欢迎来到微软 Phi-3 cookbook
这是一本关于如何使用微软 Phi-3 家族的手册。
Phi-3 是微软开发的一系列开放人工智能模型。Phi-3 模型是市面上最出色且最具成本效益的小型语言模型(SLMs),在各种语言、推理、编码和数学基准测试中超越了同等大小甚至更大尺寸的模型。
Phi-3-mini,一个3.8B的语言模型,可以在微软 Azure AI Studio、Hugging Face和Ollama上找到。Phi-3 模型在关键基准测试上显著超越同等甚至更大尺寸的语言模型(详见下面的基准测试数字,数值越高越好)。Phi-3-mini的表现优于两倍于其大小的模型,而Phi-3-small和Phi-3-medium则超越了包括GPT-3.5T在内的更大尺寸模型。
所有报告的数字都是通过相同的流程产生的,以确保数字的可比性。因此,这些数字可能与其他发布的数字有所不同,这是由于评估方法的细微差异造成的。我们的技术论文中提供了更多关于基准测试的细节。
Phi-3-small仅拥有7B参数,在各种语言、推理、编码和数学基准测试中超越了GPT-3.5T。
Phi-3-medium拥有14B参数,继续这一趋势,超越了Gemini 1.0 Pro。
Phi-3-vision仅拥有4.2B参数,继续这一趋势,在一般视觉推理任务、OCR、表格和图表理解任务中超越了如Claude-3 Haiku和Gemini 1.0 Pro V等更大尺寸的模型。
请注意:Phi-3 模型在事实知识基准测试(例如 TriviaQA)上的表现不如其他模型,因为较小的模型尺寸导致其保留事实的能力有限。
您可以学习如何使用微软 Phi-3 以及如何在不同硬件设备上构建端到端解决方案。要亲自体验 Phi-3,可以从Azure AI Playground上开始尝试模型。您也可以在Hugging Chat playground上找到该模型。开始使用Azure AI Studio构建和定制适用于您场景的 Phi-3。
贡献
本项目欢迎贡献和建议。大多数贡献需要您同意一个贡献者许可协议(CLA),声明您有权并且实际上确实授予我们使用您的贡献的权利。详情访问 https://cla.opensource.microsoft.com。
当您提交一个拉取请求时,CLA 机器人会自动确定您是否需要提供同上。