性能超越GPT35Mistral8x7B是目前最好的开源LLM

性能超越GPT35Mistral8x7B是目前最好的开源LLM-3

欧洲初创公司Mistral最新发布Mixtral 8x7B,采用独特“专家混合”技术,介绍展示了该模型性能超越GPT-3.5和Llama 2系列。同时,该公司完成了由A16z领投的4.15亿美元A轮融资,估值达20亿美元,引发市场对其潜力的广泛关注。

Mistral成为欧洲历史上最成功的初创公司之一,专注于开发开源大型语言模型(LLMs)。该公司最新推出的产品,即Mixtral 8x7B,以其采用的“专家混合”技术命名。这一技术将不同的模型融合在一起,每个模型专门处理不同类别的任务。

上周,Mistral沿袭其一贯风格,通过种子链接发布了这一新模型,毫不解释、未附博客文章或演示视频,但至少在X和LinkedIn上的早期采用者和人工智能影响者群体中取得了成功。

性能超越GPT35Mistral8x7B是目前最好的开源LLM-4

最新的博客文章详细介绍了Mixtral 8x7B,并展示了一些基准测试结果,证明其在性能上与OpenAI的闭源GPT-3.5以及Meta的Llama 2系列相当甚至更为卓越,后者曾是开源人工智能领域的领导者。Mistral公司坦承在训练过程中与CoreWeave和Scaleway合作,提供技术支持。同时,他们明确表示,Mixtral 8x7B可在商业用途中遵循Apache 2.0许可。

性能超越GPT35Mistral8x7B是目前最好的开源LLM-5

早期采用者已经下载了Mixtral 8x7B并开始运行,对其性能感到惊叹。由于其小巧的体积,甚至可以在没有专用GPU的机器上本地运行,包括搭载新M2 Ultra CPU的Apple Mac电脑。

性能超越GPT35Mistral8x7B是目前最好的开源LLM-6

正如宾夕法尼亚大学沃顿商学院教授、人工智能影响者Ethan Mollick在X上指出的,Mistral 8x7B似乎“没有安全保护装置”,这表明那些对OpenAI日益严格的内容政策感到不满的用户,现在可以获得一个性能相当的模型,其生成的内容被其他模型视为“不安全”或不适宜的。然而,缺乏安全保护装置也可能对政策制定者和监管机构构成挑战。

HuggingFace提供了一个尝试Mistral 8x7B的平台,其实现包含了安全保护装置。

Mistral公司还展示了更强大的模型,HyperWrite AI首席执行官Matt Schumer在X上指出,该公司已经在其应用程序编程接口(API)上推出了Mistral-medium的Alpha版本,该版本也于本周末发布,显示出更大、性能更强的模型正在研发中。

此外,Mistral公司完成了由A16z领投的4.15亿美元A轮融资,估值达到20亿美元。这标志着投资者对该公司的信心,同时也凸显了市场对其在人工智能领域中的前景寄予厚望。

版权声明:
作者:小火箭
链接:https://www.xiaohuojian8.top/210.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>