为超出 OpenAI GPT

- 编辑:宝博游戏大厅官网 -

为超出 OpenAI GPT

IT之家 1 月 15 日新闻,周二,在一场波及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公然了 Meta 高管跟研讨职员的外部通讯记载。这些文件表现,Meta 在开辟其最新 AI 模子 Llama 3 的进程中,高管跟研讨职员将超出 OpenAI 的 GPT-4 视为中心目的,并在外部探讨中表示出极强的竞争认识。Meta 天生式 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月发给研讨员 Hugo Touvron 的新闻中表现:“说瞎话…… 咱们的目的必需是 GPT-4。咱们行将领有 64,000 个 GPU!咱们必需学会怎样构建前沿技巧并博得这场比赛。”只管 Meta 始终以开源 AI 模子著称,但其 AI 团队显然更存眷怎样超出那些不公然模子权重的竞争敌手,比方 Anthropic 跟 OpenAI。Meta 的高管跟研讨职员将 Anthropic 的 Claude 跟 OpenAI 的 GPT-4 视为行业标杆,并以此为目的尽力。在外部探讨中,Meta 对法国 AI 始创公司 Mistral 的立场显得嗤之以鼻。Mistral 是 Meta 在开源范畴的重要竞争敌手之一,但 Al-Dahle 在新闻中直言:“Mistral 对咱们来说何足道哉。咱们应当能做得更好。”以后,科技公司正竞相推出尖端 AI 模子,而 Meta 的外部通讯进一步提醒了其 AI 引导层的高度竞争心态。在屡次交换中,Meta 的 AI 担任人提到,他们在获取练习 Llama 模子所需数据时表示得“十分保守”。一位高管乃至在一封外部邮件中表现:“Llama 3 多少乎是我独一关怀的事件。”但是,这种保守的竞争战略也激发了执法成绩。本案查察官控告 Meta 高管在匆仓促推出 AI 模子的进程中,存在应用受版权维护的册本停止练习的行动。Touvron 在一份新闻中指出,用于练习 Llama 2 的数据集“品质欠安”,并探讨了怎样经由过程优化数据源来晋升 Llama 3 的表示。随后,Touvron 跟 Al-Dahle 探讨了应用 LibGen 数据集的可能性,该数据集包括 Cengage Learning、Macmillan Learning、McGraw Hill 跟 Pearson Education 等出书商的受版权维护作品。Al-Dahle 在新闻中问道:“咱们能否有适合的数据集?有不什么数据是你想用却由于某些笨拙的起因无奈应用的?”IT之家留神到,Meta 首席履行官马克・扎克伯格此前曾表现,他正努力于缩小 Llama 模子与 OpenAI、谷歌等公司的闭源模子之间的机能差距。外部新闻表现,公司外部为实现这一目的蒙受了宏大压力。扎克伯格在 2024 年 7 月的一封信中写道:“往年,Llama 3 曾经可能与开始进的模子竞争,并在某些范畴处于当先位置。从来岁开端,咱们估计将来的 Llama 模子将成为行业中开始进的。”2024 年 4 月,Meta 正式宣布了 Llama 3。这款开源 AI 模子在机能上与谷歌、OpenAI 跟 Anthropic 的闭源模子并驾齐驱,并超出了 Mistral 的开源模子。但是,Meta 用于练习模子的数据 —— 只管扎克伯格据称同意应用这些数据,但其版权状况存疑,正在多告状讼中面对检察。