GPT-4V

  • 微软发布了一份166页的论文《LMM 的黎明:GPT-4V (ision) 的初步探索》

    摘要 多模态大模型(LMMs)不仅拥有大型语言模型(LLMs)的特点,还拓宽了其多感官技能,例如视觉理解,从而实现了更强的通用智能。 本文深入探索并分析了最新的 GPT-4V(ision) 模型,旨在加深我们对 LMMs 的认识。我们的分析重点是 GPT-4V 能够完成的各种有趣任务,通过一系列精心设计的测试样本,来检验 GPT-4V 能力的质量和通用性,以及它所支持的输入和工…

    2023年10月3日