Halo
发布于 2023-09-22 / 87 阅读 / 0 评论 / 0 点赞

多模态

多模态

相较于图像、语音、文本等多媒体(Multi-media)数据划分形式,“模态”是一个更为细粒度的概念,同一媒介下可存在不同的模态。

比如我们可以把两种不同的语言当做是两种模态,甚至在两种不同情况下采集到的数据集,亦可认为是两种模态。

多模态AI

多模态人工智能是一种人工智能,它将多种类型或模式的数据结合起来,从而对现实世界中的问题做出更准确的判断、得出深刻的结论或进行更精确的预测。

多模态人工智能系统通过视频、音频、语音、图像、文本和一系列传统的数字数据集进行训练和使用。

最重要的是,多模态人工智能意味着众多数据类型被串联使用,以帮助人工智能确定内容并更好地解释上下文,而这正是早期人工智能所缺乏的。


评论