Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Từ đáy của chúng tôi đã mã hóa - ForkLog: tiền điện tử, AI, siêu đặc, tương lai
Hướng dẫn khởi chạy các mô hình AI mở từ kho GitHub sâu thẳm
Trong sự phát triển của AI đã xuất hiện một hướng đi, trong đó phân quyền và mã nguồn mở cho phép vượt ra ngoài các giải pháp thương mại phổ biến. Các LLM cục bộ cho phép làm việc với dữ liệu riêng tư, tùy chỉnh hệ thống linh hoạt theo nhiệm vụ của mình và tự kiểm soát môi trường sử dụng. Đồng thời, việc khởi chạy các mô hình này đòi hỏi hiểu biết về các công cụ cơ bản — từ kho lưu trữ và trọng số mô hình đến môi trường đám mây và đặc điểm kỹ thuật.
Trong bài viết mới này, ForkLog sẽ kể cách bắt đầu làm quen với các mô hình AI tự trị mà không tốn chi phí, các nguồn tài nguyên nào phù hợp cho người mới bắt đầu và các nhà phát triển giải pháp mã nguồn mở đang cung cấp gì.
Giao diện ban đầu
Đối với các nhà phát triển mô hình AI mở, có hai nền tảng chính — GitHub và Hugging Face. Cái thứ nhất truyền thống dùng để đăng tải mã nguồn, tài liệu và script cài đặt, còn cái thứ hai trở thành trung tâm toàn cầu cho trọng số mô hình, bộ dữ liệu và các giải pháp ML sẵn có. Trên Hugging Face có hàng trăm nghìn mạng neural đã huấn luyện, từ các mô hình ngôn ngữ nhỏ gọn cho điện thoại, các trình tạo nội dung media thay thế đến các thuật toán chuyên biệt dành cho nhà khoa học và người đam mê.
Việc chọn mô hình phù hợp dựa vào các chỉ số hoạt động của cộng đồng. Trên GitHub, chúng thể hiện qua số sao (stars), tần suất cập nhật (commits) và tốc độ xử lý vấn đề (issues).
Ngoài ra, cần kiểm tra nguồn gốc sản phẩm và tính xác thực của kho lưu trữ. Các bản OS phổ biến thường xuyên trở thành mồi nhử cho tội phạm mạng, phát tán mã độc dưới dạng các công cụ AI nổi tiếng.
Bước tiếp theo để làm quen với các mô hình AI cục bộ là thử nghiệm chức năng của chúng trên thực tế. Đối với người dùng không có phần cứng mạnh, có các nền tảng đám mây miễn phí hoặc bán miễn phí tạm thời như:
Giải pháp phổ biến nhất — Google Colab — môi trường đám mây cung cấp quyền truy cập vào GPU ngay trong trình duyệt. Gói miễn phí cho phép làm việc trên hệ thống có GPU Nvidia Tesla T4 trung bình từ hai đến bốn giờ tùy theo tải. Các lựa chọn thay thế là Kaggle Notebooks và Hugging Face Spaces. Cái cuối cùng cho phép tương tác với các mô hình qua các giao diện web sẵn có như Gradio hoặc Streamlit.
Ngoài ra, khi làm việc với các giải pháp liên kết phân tán, cần chú ý đến khía cạnh pháp lý. Nhiều dự án phổ biến được cấp phép theo các giấy phép cổ điển như MIT hoặc Apache 2.0, cho phép sử dụng cả trong mục đích thương mại với các hạn chế tối thiểu.
Tuy nhiên, cũng có các phương pháp đặc thù. Meta phân phối các mô hình flagship của mình theo giấy phép riêng Llama 3.1 Community License, yêu cầu xin phép đặc biệt nếu số lượng người dùng hàng tháng vượt quá 700 triệu.
Các giấy phép copyleft nghiêm ngặt như GNU General Public License cũng xuất hiện, bắt buộc phải mở mã nguồn của tất cả các sản phẩm dựa trên.
Mô hình ChatGPT cá nhân của tôi
Trong số hàng nghìn LLM đa năng (tương tự ChatGPT hoặc Gemini), việc chọn mô hình phù hợp giúp dựa vào các bảng xếp hạng độc lập dựa trên thử nghiệm mù và các chỉ số hiệu suất như Open LLM Leaderboard và Chatbot Arena.
Trong thử nghiệm thực hiện để viết bài này, mô hình qwen3.5:2b đã chạy được trên laptop không có card đồ họa rời, dựa trên Core i7 với 8 GB RAM và SSD, đồng thời đóng các ứng dụng nặng như trình nhắn tin và trình duyệt.
Mỗi tham số chiếm không gian vật lý trên ổ cứng và quan trọng nhất, trong RAM. 2b sử dụng khoảng 4-5 GB RAM và là mức tối đa có thể chạy trên máy như vậy. Tuy nhiên, phản hồi cho yêu cầu đơn giản như «xin chào!» gần như mất tới ba phút.
Trong nghiên cứu gần đây về coding trong Web3, Vladimir Sliper phát hiện rằng các mô hình như qwen2.5-coder:7b, qwen3:8b, llama3.2:3b, deepseek-r1:8b phù hợp cho máy MacBook Air 16 GB RAM. Các mô hình mạnh hơn cần đầu tư vào PC cao cấp với card đồ họa hàng đầu hoặc thuê máy chủ.
Xử lý dữ liệu riêng tư, in 3D và bảo vệ người dùng
Các tùy chọn tương tác với các mô hình AI mở phụ thuộc vào trình độ kỹ năng của người dùng và phần cứng. Có các dự án đóng gói sẵn trong các trình cài đặt tiện lợi (.EXE) hoặc ứng dụng di động «ngay lập tức». Các dự án khác là các kho GitHub bỏ hoang, cài đặt kéo dài nhiều giờ do xung đột thư viện cũ.
Các mô hình AI ứng dụng ngày nay không chỉ dùng để tạo nội dung văn bản. Ngay cả phân tích hệ sinh thái sơ bộ cũng cho thấy hàng chục công cụ chuyên biệt cho các nhiệm vụ cụ thể:
Làm việc với video và 3D:
Chiến đấu với thư viện và thành công ban đầu
Sau khi cài đặt các mô hình AI có giao diện người dùng thân thiện, cần xác định xem có dễ dàng triển khai kho lưu trữ nặng trong đám mây miễn phí hay không.
FLUX.1 của startup Black Forest Labs — một trong các mô hình tạo hình ảnh hàng đầu, cạnh tranh với Midjourney và Nano Banana của các tập đoàn. Với phần cứng phù hợp, phần mềm có thể hoạt động độc lập không cần internet và vượt qua kiểm duyệt.
Trong thử nghiệm, dùng phiên bản miễn phí nhẹ nhất của FLUX.1 Schnell. Để dễ dàng làm việc với các giải pháp mở, các nhà phát triển tạo ra các framework như Ollama. Các giao diện đồ họa như ComfyUI và Forge rất phổ biến để tạo hình ảnh.
Trong quá trình cài đặt Forge — cagliostro-forge-colab — phải dành một phiên truy cập GPU của Google Colab. Vấn đề là lỗi phổ biến của người mới — không phù hợp giữa các phiên bản Python, môi trường đám mây và mô hình. Trong bốn giờ thử nghiệm, không thể thành công với Gemini 3 Flash miễn phí.
Cuối cùng, phải bỏ qua cài đặt framework và chuyển sang triển khai trực tiếp FLUX.1, nhưng lần sau trong phiên miễn phí khác.
Trong thực tế, Google Colab miễn phí phù hợp hơn để dùng vào cuối tuần: thời điểm này, nền tảng thường cung cấp quyền truy cập lâu hơn.
Mô hình chiếm khoảng 34 GB dung lượng SSD đám mây. Tuy nhiên, toàn bộ quá trình cài đặt tiêu tốn khoảng 86 GB.
Các mạng nơ-ron mở đã được sử dụng không chỉ để tạo nội dung văn bản và hình ảnh mà còn cho các nhiệm vụ đặc thù và kỳ lạ hơn. Một ví dụ nổi bật là mô hình GameNGen, có khả năng tái tạo quá trình chơi game của shooter cổ điển DOOM trong thời gian thực.
Trong các hệ thống tự trị, nổi bật là dự án Voyager — AI agent cho Minecraft. Nó tự khám phá thế giới game, khai thác tài nguyên và liên tục tự học.
Cộng đồng khoa học cũng tích cực tùy biến AI mở cho các mục đích riêng, ví dụ, dùng thuật toán để giải mã lịch sử. Các nhà nghiên cứu từ Tel Aviv và Munich đã huấn luyện mô hình Akkademia dịch trực tiếp chữ cuneiform cổ sang tiếng Anh. Nó giúp xử lý hàng nghìn bảng đất sét bị hư hỏng, rút ngắn thời gian của các nhà khảo cổ hàng chục lần.
Không kém phần thú vị là dự án MinD-Vis. Hệ thống này phân tích dữ liệu MRI chức năng và cố gắng tái tạo hình ảnh mà người thử nghiệm quan sát trong quá trình quét. Tức là, tạo ra diễn giải về những gì người đó nhìn thấy dựa trên các mẫu hoạt động của não.
Các sáng kiến này chứng minh rằng trí tuệ nhân tạo đã trở thành công cụ đa năng để khám phá và mô phỏng thực tế. Chuyển đổi từ API doanh nghiệp đóng sang mã nguồn mở tạo ra một mô hình phát triển hoàn toàn mới. Ngày nay, bất kỳ nhà nghiên cứu, nhà phát triển hay người đam mê nào cũng có thể triển khai hạ tầng mà vài năm trước đây đòi hỏi hàng triệu đô la đầu tư vào các trang trại máy chủ.
Sự phát triển của hệ sinh thái đi kèm với việc nâng cao trải nghiệm người dùng: thay thế các script phức tạp bằng giao diện trực quan và môi trường tự động hóa. Việc sử dụng các công cụ như Ollama và Forge cho thấy rằng quyền riêng tư, không kiểm duyệt và hiệu suất cao có thể cùng tồn tại trong một giải pháp phần mềm. Tương lai của ngành AI ngày nay phần lớn phụ thuộc vào việc hệ sinh thái mở có còn mạnh mẽ, mở rộng và độc lập hay không.