xAI 推出具有视觉能力的 Grok 1.5 Vision 大模型
马斯克旗下的 xAI 推出了其首款多模态大模型 Grok 1.5 Vision 。除了文本功能外, Grok 现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。
xAI 重点展示了 Grok-1.5V 的7个示例,包括:将手绘图表转换成 Python 代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成 csv 格式、解答生活日常问题、解决代码问题。
—— xAI