代码编织梦想

旷视实战大模型:把多模态扎进行业-爱代码爱编程

允中 发自 凹非寺量子位 | 公众号 QbitAI 距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻,已经过去了整整一年的时间。在这一年里,国内外大量公司涌入大模型的“斗兽场”,加速大模型技术的迭代与跃迁。 大模型前所未有的通用任务处理能力,让所有人看到了解锁更多应用场景的可能性。各行各业开始从自身业务出发,探索与大模型结合的可能

iclr 2024 | llm agent领域第一高分论文,全网star数最高的多智能体框架-爱代码爱编程

在探索大规模语言模型(LLMs)的应用上,自主智能体展现了巨大的潜力,能够增强和模拟人类工作流程。目前研究主要集中在以角色扮演形式驱动 LLMs,通过多轮对话解决问题。然而,在面对更为复杂的任务时,简单地连接多个 LLM 可能导致解决问题的不可控性,难以满足实际需求。人类通过长期实践积累了各种领域的标准操作流程(SOPs),这些 SOPs 在任

tiktok美区达人带货-爱代码爱编程

目前TikTok电商在美国的日均GMV已突破1200万美元,黑五大促期间更是一度飙升至3300万美元,成为其至今所有已上线的国家和地区当中增速最快的。 “今年5月时,TikTok电商的GMV为20万美元/天,8月达到500

字节跳动加快期权归属节奏:入职第一年可行权20%-爱代码爱编程

雷递网 乐天 1月19日 近期,字节跳动发布全员邮件,从2024年起,除入职第一年外,从“按年归属”调整为“按季度归属”。同时,四年归属比例从“15%-25%-25%-35%”变成“20%-25%-25%-30%”,第一年归属比例提高。 2025年1月起,字节跳动员工的年度激励会由“全年奖”和“绩效期权”两部分构成。 全年奖最高为3

中科院 ai 团队最新研究发现,大模型可通过自我验证提高推理性能-爱代码爱编程

来源:AI科技评论 本文约4000字,建议阅读10分钟 本文介绍了中科院AI团队的新发现:大模型可通过自我验证提高推理性能。 推理能力是机器接近人类智能的一个重要指标。 最近的大型语言模型(Large language mode,LLM)正在变得越来越擅长推理,背后的一个关键技术是思维链(chain-of-thoug

抖音是怎么动摇美国国本的?-爱代码爱编程

作者:观雨者 在美国流行着这么一个社交软件,只要不违反法律,你想看什么它就给你推送什么,你想表达什么它就让你发布什么。 这是一款充满自由气息的软件,名字叫TikTok,也就是我们常说的国际版抖音。 奇怪的打压 从公司结构上来说,“TikTok国际”和“抖音”都是字节跳动的子公司。 该软件可以说是中国出海最成功的产品之一,在这

2023年终盘点:图文大模型编年简史-爱代码爱编程

前言 理解GPT-4V, 成为GPT-4V, 超越GPT-4V。 这不是一个段子,而是大模型极客内心的涌动。 2023年是一个重要的年份。 是前进的一年, 是提速的一年, 大语言模型的历史意义,已属非凡。 但我今天想讲的,不止大语言模型。 有风掠过田野,图文模型迅猛成长,取得实质性进展。 模型就像机器人,

综述 | 最新整理!面向时间序列和时空数据的大模型-爱代码爱编程

本文约11000字,建议阅读10+分钟 本文是一篇关于时间序列和时空数据的大模型的调查综述。 时间数据,特别是时间序列和时空数据,在现实世界的应用中普遍存在。这些数据捕获动态系统的测量值,并由物理和虚拟传感器大量产生。分析这些数据类型对于利用它们所包含的丰富信息至关重要,从而有益于各种下游任务。近年来,大语言模型和其他基础模型的进步促使这些

史上最大开源llm,参数高达3140亿!马斯克如约开源grok,10小时狂揽10000颗star-爱代码爱编程

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 气「OpenAI 不 Open」以至于对其发起诉讼之后,马斯克践行自己自由、开放的原则,在刚刚过去的周末里选择重磅开源自家的 AI 大模型——Grok-1(https://github.com/xai-org/grok-1)。 距离 Grok-1 开源仅过去了 10 个小

awe2024:小狗吸尘器携多款新品亮相-爱代码爱编程

3月14日,与德国IFA、美国CES并肩的全球前三国际家电及消费电子展览会-中国家电及消费电子博览会(以下简称AWE)在上海新国际博览中心隆重举行。小狗吸尘器携旗下多款新品亮相,向全球消费者和家电及消费电子领域业界全方位展示了其创新成果。 展会期间,作为24年专业吸尘器品牌,小狗吸尘器备受瞩目,展台内参展人群络绎不绝,纷纷在小狗吸尘器展区驻

awe2024:科沃斯集团携双品牌亮相-爱代码爱编程

3月14日-3月17日,科沃斯集团旗下“科沃斯机器人”与“TINECO添可”携多款服务机器人与智能家电产品亮相中国家电及消费电子博览会(AWE)现场,为到场消费者带来生活新方式新体验。科沃斯集团成立于1998年,26年来,在自主研发和创新驱动下,掌握了核心机器人及智能技术,逐步成长为服务机器人与高端智能电器两大行业的开拓者和引领者。 灵隙灵

一套方案有效实现 cocos 资源加密!web/原生多平台适用-爱代码爱编程

引言:在10月29日 Cocos Star Meeings 上海站上,羽毛先生分享了 3.x 资源加密与自定义一键打包相关方案,本文为分享内容的文字版。(PS. 公众号后台回复关键字【上海】,即可下载上海站嘉宾演讲 PPT 合集)。 资源加密是保障项目安全的重要一环。本次和大家分享一个资源加密与解密的完整方案,能够支持多平台的资源加密与解密功能,

单样本微调给chatglm2注入知识~-爱代码爱编程

来自:算法美食屋 进NLP群—>加入大模型与NLP交流群 前方干货预警:这可能也是一篇会改变你对LLM微调范式,以及对LLM原理理解的文章。 同时这也是一篇非常有趣好玩,具有强大实操性的ChatGLM2微调喂饭级教程。 我们演示了使用AdaLoRA算法,使用1条样本对ChatGLM2-6b实施微调。几分钟就成功注入了"梦中情炉"

带你读论文第二期:复旦大学员司雨,荣获acl outstanding paper award 2023!-爱代码爱编程

 Datawhale干货  来源:WhalePaper,负责人:芙蕖 WhalePaper简介 由Datawhale团队成员发起,对目前学术论文中比较成熟的 Topic 和开源方案进行分享,通过一起阅读、分享论文学习的方式帮助大家更好地“高效+全面+自律”学习,让大家都有所收获和提升!方向包括自然语言处理(NLP)、计算机视觉(CV)、推

姚期智领衔提出大模型「思维」框架!逻辑推理正确率达98%,思考方式更像人类了...-爱代码爱编程

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【多模态和Transformer】交流群 在CVer微信公众号后台回复:累积推理,可以下载本论文pdf和代码,学起来! 西风 发自 凹非寺转载自:量子位(QbitAI) 图灵奖得主姚期智领衔的首篇大语言模型论文来了! 一出手,

大模型推理框架概述-爱代码爱编程

来自:吃果冻不吐果冻皮 进NLP群—>加入NLP交流群 从 ChatGPT 面世以来,引领了大模型时代的变革,除了大模型遍地开花以外,承载大模型进行推理的框架也是层出不穷,大有百家争鸣的态势。本文主要针对业界知名度较高的一些大模型推理框架进行相应的概述。 vLLM GitHub: https://github.com/vl

苹果大模型mm1杀入场:300亿参数、多模态、moe架构,超半数作者是华人-爱代码爱编程

点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 公众号ID|计算机视觉研究院 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2403.09611.pdf 计算机视觉研究院专栏 Column of Computer Vision Institut

大模型推理核心技术:continuous batching详解-爱代码爱编程

作者:方佳瑞,腾讯 · Principal Software Engineer,清华大学计算机科学与技术博士个人主页:https://fangjiarui.github.io 整理:青稞AI Continuous Batching现已成为大型模型推理框架的关键技术,也是框架性能优化的主战场。通过将多个在线请求进行批处理(

什么是cxl技术?cxl的三种模式、类型、应用-爱代码爱编程

点击蓝字关注我们 关注、星标公众号,精彩内容每日送达 来源:网络素材 CXL (Compute Express Link) 技术是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,以满足现代计算和存储系统的需求。它最初由英特尔、AMD和其他公司联合推出,并得到了包括谷歌、微软等公司在内的大量支持。 一、CXL介绍 CXL的

详解多模态大模型:llava+llava1.5+llava-爱代码爱编程

作者:凯恩博,香港城市大学计算机科学博士 编辑:青稞AI LLaVA repo:https://github.com/haotian-liu/LLaVA/ LLaVA 1.0:Visual Instruction Tuning LLaVA 1.5:Improved Baselines with Visual Instructi