📢 Gate 广场 TradFi 交易分享挑战上线!
晒单瓜分 $30,000 奖池,新人首帖 100% 中奖!
📌 参与方式:
带 #TradFi交易分享挑战 发帖,满足以下任一即可:
🔹 带今日指定 TradFi 币种标签发帖交流。
🔹 完成单笔大于 $10U 的 TradFi CFD 交易并挂载交易卡片。
🏷️ 今日指定标签:USDJPY、AUDUSD、US30、TSLA、JPN225
🎁 宠粉福利:
1️⃣ 卡片分享奖: 抽 50 人,每人送 $100 仓位体验券!
2️⃣ 发帖榜单奖: 冲排行榜,赢 WCTC 限定 T 恤!
3️⃣ 新粉见面礼: 新人首次发帖,100% 领 $10 体验券!
详情:https://www.gate.com/announcements/article/51221
从底部开始编码 - ForkLog:加密货币、人工智能、奇点、未来
关于从深层GitHub启动开源AI模型的指南
在AI的发展中,出现了一个方向,去中心化和开源代码使得超越流行商业解决方案成为可能。本地LLM允许私密处理数据,灵活配置系统以满足自己的任务,并自主控制使用环境。同时,启动这些模型需要理解基本工具——从仓库和模型权重到云端环境和技术参数。
在新材料中,ForkLog将介绍如何零成本入门自主AI模型,哪些资源适合新手,以及OS解决方案的开发者提供了什么。
初次了解
对于开源AI模型的开发者,有两个主要平台——GitHub和Hugging Face。前者传统上用于发布源代码、文档和安装脚本,后者成为模型权重、数据集和成熟ML解决方案的全球集散地。在Hugging Face上发布的有数十万训练好的神经网络,从适合手机的小型语言模型、替代媒体内容生成器,到面向科学家和爱好者的专业算法。
社区活跃度指标帮助选择所需模型。GitHub上表现为星标数量(stars)、更新频率(commits)和问题解决速度(issues)。
同时,重要的是验证产品来源和仓库的真实性。流行的OS打包经常成为网络诈骗的诱饵,散布带有恶意代码的知名AI工具。
下一步,了解本地AI模型——试用其功能。没有强大硬件的用户可以使用免费或条件免费云平台
最受欢迎的方案是Google Colab——一种云环境,直接在浏览器中提供GPU访问。免费订阅允许在配备Nvidia Tesla T4加速器的系统上工作,时间从两小时到四小时不等,取决于负载。替代方案有Kaggle Notebooks和Hugging Face Spaces。后者允许通过Gradio或Streamlit等现成网页界面与模型交互。
在使用联邦解决方案时,还应考虑法律方面。许多流行项目以MIT或Apache 2.0等经典许可证发布,允许在商业用途中以最低限制使用。
但也存在特殊方案。Meta以自有许可证Llama 3.1 Community License发布其旗舰模型,若月活用户超过7亿,则需获得特别许可。
严格的Copyleft许可证如GNU通用公共许可证(GPL)也存在,要求开源所有派生产品的代码。
我的ChatGPT个人版
在众多通用自主LLM(如ChatGPT或Gemini的类似物)中,选择合适模型的依据是基于盲测和性能指标的独立排名,比如Open LLM Leaderboard和Chatbot Arena。
在为写作本文进行测试时,Qwen3.5:2b模型在没有离散显卡的Core i7笔记本上成功运行,配备8GB RAM和SSD,同时关闭了繁重的应用:即时通讯和浏览器。
每个参数占用硬盘空间,最重要的是占用内存。2b模型大约用掉4-5GB RAM,已是此类设备的最大可行规模。即便如此,简单请求“你好!”的响应也会耗时近三分钟。
在Web3中,弗拉基米尔·斯利珀最近的研究发现,MacBook Air 16GB RAM上可以用Qwen2.5-coder:7b、Qwen3:8b、Llama3.2:3b、DeepSeek-r1:8b等模型帮忙VibCoding。更强的模型则需要投资高端PC或租用服务器。
私人数据处理、3D打印与用户保护
与开源AI模型的交互方式取决于用户的技术水平和硬件条件。有些项目打包成便捷的安装程序(.EXE文件)或移动应用“开箱即用”。另一些则是废弃的GitHub仓库,安装过程可能变成与过时库冲突的长时间战斗。
当今,应用型AI模型不仅用于文本生成。即使是表面分析生态系统,也能找到数十个专用工具满足特定任务
视频与3D处理:
与库的斗争与首次成功
安装好UI/UX清晰的AI模型后,需验证在云端免费部署繁重仓库的难易程度。
FLUX.1由Black Forest Labs创业公司推出,是领先的图像生成模型之一,与Midjourney和Nano Banana竞争。只要硬件满足,软件可离线运行,且能绕过审查。
测试中使用了最轻量的免费版本——FLUX.1 Schnell。为便于与开源方案交互,开发者创建了如Ollama的目标框架。图像生成常用的界面有ComfyUI和Forge。
在尝试安装Forge实现——cagliostro-forge-colab时,花费了整整一节Google Colab的GPU时间。问题出在新手常犯的错误——Python版本、云环境和模型不匹配。四小时的VibCoding未能用免费版Gemini 3 Flash取得成功。
最终放弃了框架安装,改为在下一次空闲时段直接部署FLUX.1,但在另一日的免费会话中。
实际操作中,免费Google Colab在周末更方便:此时平台常提供更长时间的访问。
模型占用了大约34GB的云端SSD空间,但所有相关安装过程最终用掉了约86GB。
开源神经网络早已不仅用于文本和图像生成,还用于更狭窄和奇特的任务。一个典型的例子是GameNGen模型,能实时重现经典射击游戏《毁灭战士》的游戏过程。
在自主系统中,突出的项目是Voyager——Minecraft的AI代理。它自主探索游戏世界,采集资源,不断自我学习。
学术界也在积极改造开源AI以满足需求,比如用算法解读历史。特拉维夫和慕尼黑大学的研究者训练了Akkademia模型,能直接将古巴比伦楔形文字翻译成英语。它能处理数千块受损的泥板,大大加快考古工作。
同样有趣的是MinD-Vis系统。它分析功能性MRI数据,试图重建被试在扫描时观察到的图像。即根据脑活动模式生成对所见内容的解释。
这些项目证明,人工智能已成为理解和模拟现实的通用工具。从封闭的企业API到开源的转变,推动技术进入全新发展范式。如今,任何研究者、开发者或爱好者都能部署曾需数百万投入的服务器基础设施。
生态系统的发展必然伴随用户体验的提升:复杂脚本被直观界面和自动化部署所取代。Ollama和Forge等工具的使用表明,隐私、无审查和高性能可以在一个软件方案中和谐共存。未来的AI产业,很大程度上取决于开源生态的强大、可扩展和独立程度。