- 博客(471)
- 收藏
- 关注
原创 2024终极指南:AI大模型从入门到精通
AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。
2024-07-05 16:42:03 1916
原创 OpenAI最强大模型ChatGPT-4o,论文降重小技巧,国内直接使用
写论文的时候,免不了要引经据典,要引用名人的话,要引用名人的故事,要使用公式,要把定义写明白,这些内容就决定了你的论文有着居高不下的重复率,甚至是后期无论如何怎么修改,都无法撼动改变一点点这个恼人的数字。因为你要知道,论文,老师是看你给他发的第一稿,而不是查重前的第一稿,你即使内容修改,但是愿意还在,就没有问题。不过,删除法的前提是你的论文字数足够多,假设学校的要求是4万字及以上,那么,写了五万字的你就可以通过这一方法降重。系统现在对于表格的检测还不完善,在表格中重合的字数是不计入到总的重合率中的。
2024-06-28 10:55:19 2354
原创 2025最新最全【大模型学习路线规划】零基础入门到精通
目标:了解大模型的基本概念和背景。内容:人工智能演进与大模型兴起。大模型定义及通用人工智能定义。GPT模型的发展历程。目标:深入学习大模型的关键技术和工作原理。内容:算法的创新、计算能力的提升。数据的可用性与规模性、软件与工具的进步。生成式模型与大语言模型。Transformer架构解析。预训练、SFT、RLHF。目标:掌握大模型开发所需的编程基础和工具。内容:Python编程基础。Python常用库和工具。提示工程基础。目标:通过实战项目深化理论知识和提升应用能力。
2024-11-17 10:00:00 329
原创 【手把手包会】Chroma + Ollama + gradio 搭建本地RAG应用
大型语言模型(LLM)大型语言模型(LLM)是基于大规模文本语料库(如图书、网页内容等)进行训练的深度学习模型,旨在掌握广泛的自然语言处理能力。尽管这类模型能够推断出大量的信息,但其知识边界严格受限于截止到某一特定时间点的训练数据集。LangChainLangChain 是一个面向开发者的框架,专注于构建以大型语言模型(LLM)为核心的应用程序。该框架提供了一系列丰富的接口和模块化组件,极大地简化了开发者在设计和实现基于 LLM 的解决方案过程中的复杂度。Ollama。
2024-11-17 09:30:00 1165
原创 如何突破多模态数据瓶颈?阿里通义提出多模态指令进化方法MMEvol
现有的图文指令数据存在以下三个主要问题:**1. 指令形式单一:**手工标注的指令往往局限于标注者的思维方式,难以涵盖多样化任务需求。模型生成的指令则依赖预设模板,难以做到无限扩展,从而限制了模型的指令跟随能力。**2. 指令复杂度不足:**标注者多偏向于创建简单或中等难度的问题,而模型自动生成的指令常表现为简短回答,缺乏视觉推理步骤,使模型难以应对真实世界的复杂任务。
2024-11-17 09:00:00 1071
原创 转行AI大模型产品、AI应用产品、AI设计师后,真实的工作状态到底如何?
从ChatGPT的爆火,再到AI绘图的横空出世,相信这两年大家或多或少会接触到了AIGC的相关行业消息。以前一台电脑十杯咖,一张效果图磨一周,从enscape到vray到d5再到ps……现在gpt生成文案、mj垫图、关键词生成图片风格、sd大模型选取、lora增加亿点点细节……当年的室友穿越过来问我,为啥你不用熬夜了?!都说土建行业下行成为既定事实,AI出图的广泛应用让不少中低端效果图公司处境艰难,也让不少囿于土建专业及行业的朋友们发出怒吼:把我嘎了给AI助助兴……画图狗终有一天会被AI取代!
2024-11-16 13:51:48 928
原创 万字详解:利用RAG与LangChain打造ChatPDF应用
RAG是Retrieval-augmented generation(检索增强生成)的简称,它结合了检索和生成的能力,为文本序列生成任务引入额外的外部知识(通常是私有的或者是实时的数据),就是用外部信息来增强LLM的知识。RAG 将传统的语言生成模型与大规模的外部知识库相结合,使模型在生成响应或文本时可以动态地从这些知识库中检索相关信息。这种结合方法旨在增强模型的生成能力,使其能够产生更为丰富、准确和有根据的内容,特别适合需要具体细节或外部事实支持的场合。
2024-11-16 13:48:47 578
原创 Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
LLM究竟是否拥有类似人类的符合理解和推理能力呢?许多认知科学家和机器学习研究人员,都会认为,LLM表现出类人(或「接近类人」)的语言能力。然而,来自帕维亚大学、柏林洪堡大学、得克萨斯大学休斯顿健康科学中心、纽约大学、巴塞罗那自治大学的研究者却提供了一些最全面的证据,表明目前它们基本没有!论文地址:https://www.nature.com/articles/s41598-024-79531-8。
2024-11-16 13:46:47 436
原创 AI 产品经理成长蓝图:入门到精通学习路径(AI产品经理最新学习路线)
AI产品经理区别于普通产品经理的地方,不止在懂得AI算法,更重要的是具有AI思维。这里为你精心规划了一条从入门到精通的学习路径,助你在 AI 产品领域乘风破浪🚀!📚大模型&AI产品经理如何学习第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
2024-11-15 09:52:13 892
原创 搭建个人AI知识库:RAG与本地模型实践指南
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;帮助很多人得到了学习和成长。第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
2024-11-15 09:30:00 657
原创 终于把神经网络算法搞懂了!!非常详细收藏我这一篇就够了
今天给大家分享一个强大的算法模型,神经网络神经网络算法是一种受人类大脑神经结构启发的计算模型,广泛应用于模式识别、分类、回归等任务中。神经网络通过多层神经元的层级结构对数据进行逐层处理,从而从复杂的非线性数据中提取特征和模式。
2024-11-15 09:00:00 889
原创 向量数据库:探索高效检索与大型语言模型的完美结合
在数学中,向量是一个有序的数值序列。例如,二维平面中的一个点的位置可以用两个实数的向量(x, y)来表示。同理,三维空间中的点可以用(x, y, z)表示。而在计算机科学中,这些点可以表示为事务的特征或属性,向量数据库就是用来存储这些点的特征或属性的。在本文中,我们探讨了向量数据库及其在解决大语言模型(LLM)应用中的局限性的重要性。我们了解了向量数据库的基本概念、数据存储方式以及如何进行向量数据的检索, 同时介绍了一些常见的ANN算法,如Flat、k-means、LSH等,以及它们在向量数据库中的应用。
2024-11-14 21:00:59 900
原创 大模型经典著作《大语言模型基础与前沿》
*《大语言模型基础与前沿》是由美国明尼苏达大学双城分校电子与计算机工程博士熊涛所著。**熊博士曾在多家中美知名高科技公司担任高级管理职位和首席科学家,在人工智能的多个领域,包括大语言模型、图神经网络等从事研发和管理工作多年。本书深入。
2024-11-14 12:24:18 743
原创 什么是大模型?一文读懂大模型的基本概念,让你从大模型基础到进阶,非常详细收藏我这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2024-11-14 12:20:23 451
原创 AI搜索专题报告:大模型商业落地“第一束光|附25页PDF文件下载
AI搜索——改变生产力的不二选择。搜索模式从传统线性搜索不断跃迁至AI搜索,其本质是用户检索信息方式的不断演进。AI搜索技术不仅能够生成内容,还更加注重对语义的理解和个性化推荐。此外,AI搜索技术还能连接不同的互联网服务场景,构建起智能化的产品生态系统。目前,包括三六零、科大讯飞、阿里巴巴、腾讯、字节跳动、百度等在内的多家巨头公司,以及月之暗面、智谱清言等后来者均推出具有各自特色的AI搜索产品,其背后更是用户对于AI搜索范式下的智能总结、主动提供等智能化模式的急迫需求。
2024-11-14 09:00:00 729
原创 大模型面试常见问题及详细解答,三天背完,拿下大厂offer!
注意力机制是一种模拟人类注意力分配过程的模型,它能够在处理大量信息时,选择性地关注对任务更重要的信息,忽略无关信息。在自然语言处理中,注意力机制常用于机器翻译、文本摘要、问答系统等任务中,帮助模型捕捉输入序列中的关键信息。在计算机视觉中,注意力机制也用于图像识别、目标检测等任务,使模型能够关注图像中的关键区域。
2024-11-13 09:45:50 1454
原创 15K start!让大模型拥有个性化记忆,超越RAG
Mem0 作为一种革命性的AI记忆技术,为构建个性化的AI应用提供了全新的解决方案。Mem0 不仅可以提高AI代理的智能水平,还可以为用户带来更加个性化和人性化的AI体验。相信在不久的将来,Mem0 将会应用到更多的AI应用场景中,为我们带来更加智能和便捷的生活体验。
2024-11-13 09:41:56 657
原创 通俗易懂,大模型原理及缺陷!
自从ChatGPT发布以来,用户的搜索方式以及人机交互模式都经历了显著的变革。在诸如问题回答、文本总结和交流对话等简单的应用场景中,体验质量得到了极大的提升,有时甚至超越了人类的预期表现。大模型能够生成如此全面且连贯的文本,主要归功于Transformer模型架构以及海量预训练和微调数据集的支撑。从本质上讲,大模型通过在大量数据上建立共现词概率模型来生成文本,因此“下一个词是什么”与“它在真实世界中的语义含义或真实性”无关,而是与训练数据集中所有单词及其出现位置的统计概率最有可能的情况有关。
2024-11-13 09:38:40 630
原创 大模型快速入门学习路径【持续更新】非常详细收藏我这一篇就够了
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2024-11-12 10:05:01 1182
原创 清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。目前,大语言模型赛道已经接近后期,投资人开始关注回报的问题,但相比之下,机器人赛道可以说才刚刚开始。作为柏睿资本投资的首家具身智能企业,千寻智能将借助柏睿资本和背后的产投资源,快速切入市场化落地并进行具身智能泛化性作业验证,成为国内首家实现具身智能商业化的公司。
2024-11-12 09:30:00 630
原创 一文了解Agent、RAG、LangChain之间的关系
在当今人工智能领域,Agent、RAG(Retrieval-Augmented Generation)和LangChain是三个备受关注的概念和技术。它们在不同的应用场景中发挥着重要作用,特别是在构建智能客服问答产品时,它们之间的关系和协同工作尤为重要。本文将分别对这三个概念进行释义,并通过一个构建客服问答产品的例子来说明它们如何协同工作。释义Agent(智能代理)是一种能够自主执行任务的计算机程序。它可以感知环境、做出决策并采取行动,以实现预定的目标。
2024-11-12 09:00:00 843
原创 超级干货:成为AI产品经理所需的关键技能与职业路径
本篇文章由King James来分享关于AI产品经理的必备技能和成长策略。King James之前做过AI咨询,对接公司内部AI产品经理,外部对接过很多甲方AI产品经理,也曾手持多家公司AI产品经理的offer。快读完这则诚意满满的大佬干货帖吧!回答这个问题前我们首先得理清楚什么是AI产品经理,它和传统的互联网产品经理有什么区别。主要职责一方面是规划如何将成熟的AI技术应用在各个领域不同场景中,提升原有场景的效率或效果等;
2024-11-11 12:57:47 1020
原创 构建协作型智能体:基于多代理框架的MetaGPT模型”
MetaGPT框架将标准的操作程序(SOP)与基于大模型的多智能体相结合,使用标准操作程序来编码提示,确保协调结构化和模块化输出。MetaGPT允许Agent在类似流水线的范式中扮演多中角色,通过结构化的Agent协作和强化领域特定专业知识来处理复杂任务,以提高在协作软件工程任务中解决方案的连贯性和正确性。可能小伙伴们还很陌生,不太明白具体它能做什么,我下面通过具体例子详细来介绍分析一下。我们以软件公司举例,我们拥有老板,产品经理,架构师,项目经理,工程师和测试角色。每个角色各司其职处理复杂的任务,
2024-11-11 09:30:00 1406
原创 2024年中国大语言模型能力评析报告:11大行业应用能力评测结果
*。**从专业知识储备维度来看,文心一言、腾讯混元、 通义千问、商量等大模型表现超国际水平,仍有部 分大模型的专业知识储备能力处于中国均值以下, 专业知识储备能力有待进一步提升。从行业应用能力维度来看,中国多数大模型表现较 好,展示了优秀的行业理解与应用能力,处于中国 均值以上,其中文心一言、通义千问凭借超强的行 业应用能力,表现亮眼,超国际均值。
2024-11-11 09:00:00 750
原创 了解GPT大模型,读这本书就够了!(文末送书)
小异最近发现,当国外OpenAI的权力的游戏反转再反转的时候,国内的AI创业者们除了吃瓜之外也没闲着。有很多程序员正在AIGC赛道中默默发财,有通过短视频做内容爆火,接广告的;有卖AI解决方案的;有卖AI课程的;也有卖AI产品,慢慢做大做强的…更不必说,那些拿下“人均年薪100万”大模型相关岗位的“赢家们”。你看,拼多多杀入大模型,狂发年薪百万的大模型offer。vivo副总裁周围也表示目前vivo大模型的人才成本平均税后为100万元。
2024-11-10 12:35:47 805
原创 OpenCoder:首个完全开源的顶级代码大模型,训练秘籍全公开!| LLM×MapReduce,无需训练就超越GPT-4!
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读。在当今AI时代,代码大模型正在改变着软件开发的范式。ChatGPT、Copilot等工具已经成为开发者的得力助手,但它们都像是一个神秘的"黑匣子"——你只能用,却不知其所以然。而现在,一个重磅炸弹被扔出:OpenCoder来了,它不仅性能达到顶级水平,更重要的是,它的"训练秘籍"被完全公开!OpenCoder团队做了一件前所未有的事:他们不仅开源了模型权重和推理代码,还公开了完整的训练数据、数据处理流水线、实验结果和详细的训练方案。
2024-11-10 12:27:48 788
原创 【AI产品经理赋能实战】2024最新AI产品经理从零基础到精通,字节大佬的保姆级教程,看完就业,一周收5个offer!
需求定义主要要定义清楚以下几点:1、做什么?2、为什么要做,有什么收益和价值?3、业务预期目标、上线期限?为了方便理解,我们以开发一套筛选薅羊毛用户的产品进行举例说明。1、项目背景团队发现负责的项目数据统计有些异常,细查之后,发现存在夜间偷数据的情况,大致行为路径如下:淘宝上买一批手机号,注册新账号。通过自动薅羊毛的方式(新手礼包、每日签到、周任务等),获取免费券等资源。夜深人静的时候,使用免费券或积分批量下载数据。亡羊补牢,犹未晚矣。我们决定开发一套筛选薅羊毛用户的产品,彻底堵住这个缺口。
2024-11-09 10:00:00 1022
原创 构建基于RAG检索的智能客服系统
RAG(Retrieval-Augmented Generation)检索技术是一种结合信息检索(Retrieval)和生成(Generation)的混合模型方法,旨在通过检索相关信息来增强生成模型的性能。RAG 技术特别适用于需要复杂背景信息或大规模知识库支持的任务,如问答系统、对话系统和文本生成等。
2024-11-09 09:30:00 1899
原创 苹果掉队,国产手机拿大模型向AI Agent要未来
最近两天,AI手机圈可谓“八仙过海,各显神通”。短短两周时间,华为、荣耀、苹果、小米接连放出自家最近AI手机大招,各种AI Agent和AI操作系统密集轰炸。10月29日白天,苹果正式推送iOS18.1,距WWDC发布会4个月后Apple Intelligence终于上线。当天晚上,备受关注的小米15如期发布,卢伟冰口中的AI手机终于来了。小米15搭载澎湃OS 2,并升级“小爱”为“超级小爱”。
2024-11-09 09:00:00 589
原创 【全748集】清华大佬终于把AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版!拿走不谢,学不会我退出IT圈!
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
2024-11-08 09:55:52 1036
原创 AI模型托管原理分析
AI模型托管是指将训练好的AI模型部署在云端或边缘服务器上,由第三方平台提供模型运行、管理和优化等服务。以下,AI部落小编将对AI模型托管的原理进行详细分析。AI模型托管的核心在于将AI模型与底层计算资源分离,实现模型的灵活部署和高效运行。这一技术基础主要包括以下几个方面:云计算与边缘计算:云计算提供了强大的计算能力和存储资源,使得AI模型可以在云端进行训练和推理。而边缘计算则通过将计算任务迁移到网络边缘,减少了数据传输的延迟,提高了实时性。
2024-11-08 09:30:00 642
原创 疯狂卷投流的大模型应用们,到底哪款最好用?
最近几个月里,你有没有发现在刷抖音、B站的时候被突然插入的大模型应用广告打个措手不及的频率越来越高了?近日,一篇有关大模型应用投流“买”用户的文章被不少人看到,大模型公司在二十天中动辄几千万甚至上亿的广告投放费用令人咋舌。也被媒体报道为“美国AI公司依然专注于前沿AI模型技术研究,中国AI大模型则踏上了‘卷’算力、‘卷’价格、‘卷’获客、‘卷’变现能力的道路。此后,虽然有大模型企业出面表示相关数据统计有所不实,但也未具体透露真实投放金额。
2024-11-08 09:00:00 868
原创 想转行做大模型?AI产品经理转行必读指南
如果你想转行做大模型,作为一名AI产品经理,你可以怎么做呢?或许,你可以先进行自我检测,看看自己是否真的适合转行做大模型。这篇文章里,作者便给想转行做大模型的AI产品经理们提出了一些建议,不妨来看看吧。作为一个产品经理,你可能已经熟悉了一些常见的AI技术和应用,比如机器学习、深度学习、自然语言处理、计算机视觉等。但是,你是否了解什么是大模型?大模型又有什么特点和优势?为什么大模型会成为AI领域的一个重要趋势?如果你想转行做大模型,你需要具备哪些基本素质和技能?你又该如何评估自己是否适合这个领域?
2024-11-07 12:36:24 1169
原创 掌握GLM-4大模型微调技巧:入门级实战教程——命名实体识别(NER)任务
大模型指令微调(Instruction Tuning)是一种针对大型预训练语言模型的微调技术,其核心目的是增强模型理解和执行特定指令的能力,使模型能够根据用户提供的自然语言指令准确、恰当地生成相应的输出或执行相关任务。指令微调特别关注于提升模型在遵循指令方面的一致性和准确性,从而拓宽模型在各种应用场景中的泛化能力和实用性。在实际应用中,我的理解是,指令微调更多把LLM看作一个更智能、更强大的传统NLP模型(比如Bert),来实现更高精度的NLP任务。
2024-11-07 12:33:20 773
原创 大模型也要“私人定制“?最新综述带你解锁AI的个性化服务 | 综述!扩散模型:AI艺术创作背后的“魔法引擎“
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文:1、大模型也要"私人定制"?最新综述带你解锁AI的个性化服务2、综述!扩散模型:AI艺术创作背后的"魔法引擎"3、AI助手也会"上当受骗"?最新研究揭示视觉AI的致命弱点人工智能正在飞速发展,ChatGPT等大语言模型已经成为我们生活中的"万能助手"。但你是否想过,如果AI助手能够真正理解你的个性特征,为你提供量身定制的服务,会是什么样的体验?
2024-11-07 12:29:56 311
原创 大模型落地一年后,这十个方向先跑起来
只需将电子版合同上传JoyLaw系统,几秒钟内就能得到审查反馈,金明根据提示进行修订,最快2分钟就能完成一份合同审查。金明是一名企业法务人员,在日常工作中,审查合同往往要占据他一半以上的工作量。用了JoyLaw后,他感慨“终于不用逐字逐句去读繁琐的法律条文,先系统自动审一遍,我再接着审,效率可以提升30%”。JoyLaw,是基于大模型技术打造的一款AI Agent,可自动标记出可能存在风险的合同条款。法务人金明可能并不关注什么是大模型,但JoyLaw,已经切切实实给他的工作带来了便利。
2024-11-06 09:30:00 1116
原创 打造专属知识库:利用Llama3与LangChain,通过RAG构建私人信息库
LLM存在时效性和幻觉问题,在 [如何用解决大模型时效性和准确性问题?RAG技术核心原理]一文中我介绍了RAG的核心原理,本文将分享如何基于llama3和langchain搭建本地私有知识库。
2024-11-06 09:00:00 898
原创 AIGC产品经理高频面试题❗️看完的都拿高薪了
🤔️如果你正在考虑找AI产品经理相关的工作, 建议好好准备这些面试问题, 如果想要更加详细的回答可以直接询问海螺AI哦!谁用了不说一句: AI真的太适合准备面试啦(🙀尖叫抛开之后会分享更多岗位的面试题目, 以及如何用AI准备面试的tips哦!
2024-11-05 12:08:52 833
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人