为超出 OpenAI GPT

- 编辑：宝博游戏大厅官网 - 2025-01-18 08:34

为超出 OpenAI GPT

IT之家 1 月 15 日新闻，周二，在一场波及 Meta 的人工智能版权案件（Kadrey 诉 Meta 案）中，法院公然了 Meta 高管跟研讨职员的外部通讯记载。这些文件表现，Meta 在开辟其最新 AI 模子 Llama 3 的进程中，高管跟研讨职员将超出 OpenAI 的 GPT-4 视为中心目的，并在外部探讨中表示出极强的竞争认识。Meta 天生式 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月发给研讨员 Hugo Touvron 的新闻中表现：“说瞎话…… 咱们的目的必需是 GPT-4。咱们行将领有 64,000 个 GPU！咱们必需学会怎样构建前沿技巧并博得这场比赛。”只管 Meta 始终以开源 AI 模子著称，但其 AI 团队显然更存眷怎样超出那些不公然模子权重的竞争敌手，比方 Anthropic 跟 OpenAI。Meta 的高管跟研讨职员将 Anthropic 的 Claude 跟 OpenAI 的 GPT-4 视为行业标杆，并以此为目的尽力。在外部探讨中，Meta 对法国 AI 始创公司 Mistral 的立场显得嗤之以鼻。Mistral 是 Meta 在开源范畴的重要竞争敌手之一，但 Al-Dahle 在新闻中直言：“Mistral 对咱们来说何足道哉。咱们应当能做得更好。”以后，科技公司正竞相推出尖端 AI 模子，而 Meta 的外部通讯进一步提醒了其 AI 引导层的高度竞争心态。在屡次交换中，Meta 的 AI 担任人提到，他们在获取练习 Llama 模子所需数据时表示得“十分保守”。一位高管乃至在一封外部邮件中表现：“Llama 3 多少乎是我独一关怀的事件。”但是，这种保守的竞争战略也激发了执法成绩。本案查察官控告 Meta 高管在匆仓促推出 AI 模子的进程中，存在应用受版权维护的册本停止练习的行动。Touvron 在一份新闻中指出，用于练习 Llama 2 的数据集“品质欠安”，并探讨了怎样经由过程优化数据源来晋升 Llama 3 的表示。随后，Touvron 跟 Al-Dahle 探讨了应用 LibGen 数据集的可能性，该数据集包括 Cengage Learning、Macmillan Learning、McGraw Hill 跟 Pearson Education 等出书商的受版权维护作品。Al-Dahle 在新闻中问道：“咱们能否有适合的数据集？有不什么数据是你想用却由于某些笨拙的起因无奈应用的？”IT之家留神到，Meta 首席履行官马克・扎克伯格此前曾表现，他正努力于缩小 Llama 模子与 OpenAI、谷歌等公司的闭源模子之间的机能差距。外部新闻表现，公司外部为实现这一目的蒙受了宏大压力。扎克伯格在 2024 年 7 月的一封信中写道：“往年，Llama 3 曾经可能与开始进的模子竞争，并在某些范畴处于当先位置。从来岁开端，咱们估计将来的 Llama 模子将成为行业中开始进的。”2024 年 4 月，Meta 正式宣布了 Llama 3。这款开源 AI 模子在机能上与谷歌、OpenAI 跟 Anthropic 的闭源模子并驾齐驱，并超出了 Mistral 的开源模子。但是，Meta 用于练习模子的数据 —— 只管扎克伯格据称同意应用这些数据，但其版权状况存疑，正在多告状讼中面对检察。