Bỏ qua để đến nội dung

Thiết Lập LM Studio trong Ứng Dụng Askimo

Kết nối ứng dụng Askimo với LM Studio để quản lý mô hình AI cục bộ một cách tin cậy và riêng tư.

  • Server URL: Endpoint máy chủ LM Studio
    • Mặc định: http://localhost:1234/v1
    • Từ xa: http://your-server:1234/v1
  • Timeout: Thời gian chờ kết nối (mặc định: 120s)
  • Mô Hình Sẵn Có: Tự phát hiện từ phiên bản LM Studio của bạn
  1. Tải và cài LM Studio từ lmstudio.ai
  2. Mở LM Studio
  3. Tải một mô hình từ trình duyệt mô hình
  4. Khởi chạy máy chủ cục bộ trong LM Studio:
    • Mở tab “Local Server”
    • Nhấn “Start Server”
  5. Trong Askimo, máy chủ sẽ được nhận diện tự động
  6. Chọn mô hình từ danh sách thả xuống
  7. Nhấn “Test Connection” để kiểm tra
  1. Nhấn vào thanh menu
  2. Chọn “Settings”
  3. Vào tab “AI Providers”
  4. Chọn “LM Studio” trong danh sách nhà cung cấp

Phím Tắt: ⌘ + , (macOS) hoặc Ctrl + , (Windows/Linux), sau đó chọn “AI Providers”

Tổng Hợp:

  • Llama 2 – Mô hình mã nguồn mở của Meta
  • Mistral 7B – Hiệu quả và mạnh mẽ
  • Mixtral 8x7B – Mô hình Mixture-of-Experts

Tập Trung Vào Mã:

  • CodeLlama – Chuyên cho lập trình
  • WizardCoder – Sinh mã
  • DeepSeek Coder – Trợ lý viết mã nâng cao

Nhẹ:

  • Phi-2 – Mô hình nhỏ nhưng mạnh của Microsoft
  • TinyLlama – Tùy chọn siêu nhẹ

Không Thể Kết Nối?

  • Kiểm tra máy chủ LM Studio có chạy không
  • Đảm bảo cổng 1234 không bị chặn
  • Kiểm tra URL máy chủ trong cài đặt
  • Khởi động lại LM Studio

Mô Hình Không Tải?

  • Kiểm tra mô hình đã tải đầy đủ
  • Đảm bảo RAM/VRAM đủ dùng
  • Thử mô hình nhỏ hơn trước
  • Xem nhật ký (logs) của LM Studio

Suy Luận Chậm?

  • Bật tăng tốc GPU trong LM Studio
  • Dùng mô hình lượng tử hóa (4-bit hoặc 8-bit)
  • Đóng ứng dụng không cần thiết
  • Theo dõi sử dụng RAM/VRAM

Cổng Máy Chủ Tùy Chỉnh: Nếu dùng cổng khác, cập nhật URL máy chủ:

http://localhost:CONG/v1

LM Studio Từ Xa: Kết nối tới LM Studio chạy trên máy khác:

http://IP_TU_XA:1234/v1