Kimi多模态图片懂得模子API宣布,1M tokens订价12元
1 月 15 日新闻,月之暗面本日宣布了 Kimi 多模态图片懂得模子 API,全新多模态图片懂得模子 moonshot-v1-vision-preview(以下简称“Vision 模子”)完美了 moonshot-v1 模子系列的多模态才能。模子才能阐明图像辨认Vision 模子具有图像辨认才能,可能辨认出图像中的庞杂细节跟轻微的差异,无论是食品仍是植物,可能辨别出类似但又不雷同的工具。下图示例中,官方拼集了 16 张类似的人眼较难辨别的蓝莓松饼跟吉娃娃图片,由 Vision 模子来辨认并按次序标志图片范例,无论是蓝莓松饼仍是吉娃娃,模子都能准确地域分跟辨认。笔墨辨认跟懂得Vision 模子具有高等图像辨认才能,在 OCR 笔墨辨认跟图像懂得场景中,比一般的文件扫描跟 OCR 辨认软件愈加正确,比方收条单 / 快递单等潦草的手写内容都能够正确辨认。以这张《某先生期末测验成就》柱状图为例,官方让模子提取剖析测验成就,并从美学作风的角度剖析一下该柱状图。Vision 模子也可能精准地辨认出柱状图中每个科目称号对应的分数数值并做分数对照,同时能够辨认出该柱状图的款式格局跟色彩等。模子计费Vision 模子履行按量计费方法,单张图片按 1024 tokens 兼并盘算在 Input 恳求的 tokens 用量中,模子挪用的价钱依据抉择的模子而差别,IT之家附详细辨别如下:模子计费单元价钱moonshot-v1-8k-vision-preview1M tokens¥12.00moonshot-v1-32k-vision-preview1M tokens¥24.00moonshot-v1-128k-vision-preview1M tokens¥60.00模子限度阐明Vision 视觉模子支撑的特征包含:多轮对话流式输出东西挪用JSON ModePartial Mode以下功效暂未支撑或局部支撑:联网搜寻:不支撑Context Caching:不支撑创立带有图片内容的 Context Cache,但支撑应用曾经创立胜利的 Cache 挪用 Vision 模子URL 格局的图片:不支撑,现在仅支撑应用 base64 编码的图片内容其余平台更新支撑构造名目治理功效支撑一个企业实体认证多账号增添 File 文件资本治理功效:直不雅治理检查文件资本优化资本治理列表鼠标悬浮复制Context Caching 功效已摊开给全量用户Cache 续期不再收取创立的用度【起源:IT之家】