LLAMA_ARGS="--host 0.0.0.0 --port 80 --models-preset /home/llm/presets.ini --models-max 1" # TURBO_LAYER_ADAPTIVE=1 # LLAMA_ARGS="--host 0.0.0.0 --port 80 --models-preset /home/llm/presets.ini --models-max 1 -ctk turbo3 -ctv turbo3 -fa on"