IT之家 2 月 12 日消息,AI 搜索引擎企业 Perplexity 当地时间昨日宣布推出其开发的新版 Sonar 搜索模型。该模型由 Llama 3.3 70B 进一步训练而来,对搜索应用进行了优化,运行在 Cerebras 推理基础设施上。
Perplexity 表示新版 Sonar 的 Token 解码速度达到 1200 个每秒,是 Gemini 2.0 Flash 的 8.5 倍以上,“几乎可以即时生成答案”。
而在回答质量方面,Perplexity 称其用户对新版 Sonar 模型的表现评价明显超过了 GPT-4o mini 和 Claude 3.5 Haiku,甚至高于前沿模型 Claude 3.5 Sonnet,同时与 GPT-4o 差异不大。
Perplexity 的新版 Sonar 的两大优势是其拥有更优秀的回答事实性;且能更熟练应用 markdown 格式提供可读性更佳的回答文本。
目前新版 Sonar 已向 Perplexity Pro 订阅用户开放,也将以 API 的形式提供。