▪️Installation

▪️Models

🔸commands

🔸importing models

https://docs.ollama.com/import#Importing-a-model-from-Safetensors-weights

▪️ModelFile

🔸Parameter

FROM [model name]

PARAMETER temperature 0.9
PARAMETER top_p 0.9
PARAMETER top_k 0.9
PARAMETER num_ctx 16384

# 해당 모델이 동시에 받을 수 있는 사용자 요청의 개수를 제한 (oom 방지)
PARAMETER num_parrallel 1
...

🔸prompt

FROM ...

PARAMETER ...

SYSTEM "You are ..."

▪️server

🔸launch from model list

# check downloaded model list
ollama list
# run locally with specific model
ollama run [model name]
# serve > model은 api 호출 시 특정.
OLLAMA_HOST=0.0.0.0:[PORT] ollama serve