URL Bookmark Manager
04-14-2025
强化微调技术原理 传统监督微调与强化微调的区别 监督微调: 模型通过大量输入示例学习输入特征。 优化模型的语气、风格和输出格式。 强化微调: 强化微调允许模型学习“推理新领域中的逻辑”,而不仅是模仿输入特征。 通过“奖励”正确答案的逻辑路径、“惩罚”错误答案的逻辑路径,逐步优化模型的表现。 可用极少的数据示例(例如几十个)实现显著提升。...
强化微调技术原理 传统监督微调与强化微调的区别 监督微调: 模型通过大量输入示例学习输入特征。 优化模型的语气、风格和输出格式。 强化微调: 强化微调允许模型学习“推理新领域中的逻辑”,而不仅是模仿输入特征。 通过“奖励”正确答案的逻辑路径、“惩罚”错误答案的逻辑路径,逐步优化模型的表现。 可用极少的数据示例(例如几十个)实现显著提升。...
加密货币量化...
制作陶器的小游戏...
从网站生成合并的文本文件用于LLM训练和推理...
完全本地的知识库搭建...
Neurite 是一个开源的实时可视化思维导图项目,它利用分形理论和图论构建了一个无限可扩展的创意工作空间。该项目旨在通过融合分形复杂性和现代思维导图技术,为用户提供一个独特的数字交互界面。...
R2R是一个先进的AI检索系统,支持检索增强生成(RAG),并提供生产就绪的功能。它基于容器化的RESTful API,提供多模态内容摄取、混合搜索功能、知识图谱以及全面的用户和文档管理。...
Cognita是一个开源框架,用于组织您的RAG代码库,并提供一个前端界面来试验不同的RAG自定义。它提供了一种简单的方法来组织您的代码库,使其易于在本地进行测试,同时也能够在生产环境中部署。Cognita使用Langchain/Llamaindex作为底层,并提供了一种组织代码的方式,使每个RAG组件都是模块化的、API驱动的和可扩展的。...
txtai 是一个全面的嵌入式数据库,用于语义搜索、LLM编排和语言模型工作流。它提供了矢量搜索、文本/图像/音频嵌入、LLM管道、工作流和自主代理等功能,可以帮助开发人员构建各种基于AI的应用程序。...
什么是AI Friendly的代码?...