阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch
大模型时代的三道鸿沟:数据、成本与想象力

大模型时代的三道鸿沟:数据、成本与想象力

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融
港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高

港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高

探索 AI 和医学结合更多的可能性,是人工智能发展的一个重要命题。AutoML 作为近年来备受瞩目的概念之一,被视为解决算法工程师来提高训练模型效率的一个工具,在工业、农业、零售等诸多场景中均有被使用
AI Infra 往事之异构计算篇:吴韧与他的学生们

AI Infra 往事之异构计算篇:吴韧与他的学生们

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后
MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态

MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态

2024年5月7日,MediaTek 举办天玑开发者大会2024MDDC 2024),本届大会以“AI予万物”为主题,深入研讨生成式 AI 技术为移动生态带来的变革与全新机遇。会上,MediaTek
国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将有助于提升大模型在医疗领域的专业
“寒冬”还是“拂晓”?第四范式成功上市率先交卷

“寒冬”还是“拂晓”?第四范式成功上市率先交卷

作者丨孙溥茜编辑丨陈彩娴AI科技评论消息,今天,第四范式以“6682”为股票代码,正式在香港联合交易所挂牌上市。第四范式是从去年年底大模型浪潮兴起以来首家成功上市的国内AI公司。值得注意的是,第四范式
当「养老」遇上 AI 大模型

当「养老」遇上 AI 大模型

作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又
媒体评:宿管大爷去世与高温环境关联需查清

媒体评:宿管大爷去世与高温环境关联需查清

来源:津云新闻[媒体评:宿管大爷去世与高温环境关联需查清]这两天,青岛大学一位宿管大爷去世的消息引发关注,该校通报称,初步排除刑事案件可能,具体原因正在调查中。目前看,宿管大爷的死因是否一定导向高温,
别再说国产大模型技术突破要靠 Llama 3 开源了

别再说国产大模型技术突破要靠 Llama 3 开源了

【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了
博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地

博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地

生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累,使创新成果更快地转化为产品,连接产业链上下游,也可以为人才的培养和流动提供良好平台。中国已被视为全球AI领域最具竞争力的国家。人
大模型时代的三道鸿沟:数据、成本与想象力

大模型时代的三道鸿沟:数据、成本与想象力

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融
北京:优化小客车指标配置,更好支持家庭用车需求

北京:优化小客车指标配置,更好支持家庭用车需求

7月10日,《北京市深化改革提振消费专项行动方案》对外发布。《行动方案》提出,完善汽车消费新生态。优化小客车指标配置,更好支持家庭用车需求。培育壮大二手车经营主体,持续落实二手车销售“反向开票”、异地
对话零一万物:大模型产品要找到 TC

对话零一万物:大模型产品要找到 TC

【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!上次零一万物以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。
AIGC:我不是元宇宙的附庸品

AIGC:我不是元宇宙的附庸品

“你们是从什么时候开始注意到人类的?”“当第一个原始人开始仰望星空的时候。”AI 的类人猿,早已开始仰望人类。01 来自机器的审视在过去短短的两年间,算法从业者王超岳有过两次被 AI 震撼住的时刻。一
大模型落地,向量数据库能做什么?

大模型落地,向量数据库能做什么?

在保险行业这个海量数据的“聚居地”上,数据库应用已久。近年来,保司数据化转型提速,各类文本、音视频的凭证票证核保及跑批需求不断增加,许多机构便将数据库引入至业务流程中。但是,随着数据库深入保司业务,一
美考虑再向乌提供一套“爱国者”导弹系统

美考虑再向乌提供一套“爱国者”导弹系统

美国总统特朗普9日称,他正在考虑再向乌克兰提供一套“爱国者”导弹系统。此前,特朗普已经在7日表示将向乌克兰运送更多的防御性武器。据消息人士透露,美国政府8日已恢复向乌克兰运送部分武器。五角大楼上周宣布
MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态

MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态

2024年5月7日,MediaTek 举办天玑开发者大会2024MDDC 2024),本届大会以“AI予万物”为主题,深入研讨生成式 AI 技术为移动生态带来的变革与全新机遇。会上,MediaTek
谁将替代 Transformer?

谁将替代 Transformer?

【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer
人大 Sora 思辩:Sora 到底懂不懂物理世界?

人大 Sora 思辩:Sora 到底懂不懂物理世界?

Sora 发布至今,虽然仍未正式对外开放,但对其技术细节、切实影响的讨论从未停歇。讨论的背后,是为了探索人工智能的更本质问题。对旧有视觉生成思路的检验和校正,是 Sora 带来的直观影响。在此基础上,