人工智能时代跃迁,炬芯推出多模态交互芯片迎强人工智能时代

国内新闻 浏览(1949)

强人工智能时代,多模态交互技术成为关键。

人工智能的三个阶段

经过半个世纪的发展,人工智能取得了巨大的进步。根据人工智能的发展程度,我们可以将其分为三个阶段:

来源:风险扫描仪、平安证券研究所

计算智能(Computational Intelligence):机器拥有与人类相同的内存和计算能力,因此能够存储和处理海量数据。可以帮助人类完成大量的存储和复杂的计算。这一步是感知和认知的基础。

感知智能(Perceptual Intelligence):机器具有与人类相同的感知能力。通过“眼睛”、“耳朵”和“皮肤”等器官,机器还具有视觉、听觉和触觉的感知能力。它可以帮助人类完成简单的“看”和“听”的工作。

认知智能(Cognitive Intelligence):机器与人类具有相同的学习和思考能力,可以独自做出决定和采取行动,并且可以部分或完全取代人类的工作。

人工智能是在弱人工智能时代。

目前,人工智能的发展仍然属于弱人工智能的范畴。它主要解决了计算智能和感知智能的问题,但距离能够独立思考和决策的强大人工智能时代还有一定的距离。

弱人工智能(Weak manual intelligence)主要是专门针对特定领域的专业人工智能,如语音识别和图像识别,专注于计算能力和数据积累。

单模交互技术是弱人工智能时代的典型代表特征。单模感知技术给智能机械产品带来许多限制。

单模态交互技术的局限性

目前,感知技术作为人工智能最重要的组成部分,近年来在世界各地蓬勃发展。虽然机器的单点人工智能感知模式能力正在逐步提高,但语音交互、机器视觉和传感器智能技术都取得了长足的发展。然而,单点人工智能模态感知在产品应用中有很大的局限性。

单模信号输入使机器缺乏主动服务能力,指令误判和错误唤醒时有发生,这些都会影响用户体验的本质改善。

例如,智能音箱,作为目前最热门的智能机器,经过一波浪潮,人们会发现简单的语音交互已经不能满足用户对智能机器的更高要求。

Strong人工智能下的多模态交互趋势

Strong人工智能主要指能够学习知识、思考问题和解决问题的通用智能。机器有多通道的感知和意识,并且可以在所有方面与人类平起平坐。

如果人工智能需要更好的生活体验,我们希望它能与眼睛、耳朵、鼻子、嘴巴协同工作,像人体一样积极提供服务。

多模态交互技术是实现上述要求的关键。

当今人工智能感知模式主要有三种:

语音交互(包括语音命令控制、语义理解、多轮对话、自然语言处理、精确语音识别等)。);

机器视觉(包括自然物体识别、人脸识别、身体运动识别等)。);

传感器智能(包括人工智能对热量、红外捕捉信号、空间信号、机器视觉、传感器智能的读取和理解)。

在强人工智能时代,多模态可以整合这三种感知模式。物联网设备不仅可以听和说,还可以用摄像机观察和用传感器判断。不同的信号模式集成在一起,实现设备的多维感知和思维,使智能机器走向人性化和服务的主动性。

火炬核心技术第一款多模态交互芯片

经过半个世纪的发展,人工智能技术在过去十年已经进入了快速发展的道路。高性能计算芯片,甚至人工智能芯片,海量的数据积累和优秀的软件算法都在推动人工智能的不断发展。

火炬核心技术在单模互动芯片设计方面有着多年的经验,相关产品得到了市场的广泛认可。面对

●双核架构支持更高的计算能力●数字信号处理器神经网络库(DSP NN LIB),提高算法效率●语音、手指、液晶反馈、触摸面板辅助、多模式交互●全格式图片解码、主流SWF格式解码、音视频播放器的改进、支持直播视频通话,专为电子教育

足够的计算能力、超低功耗和强大的可扩展性而设计,这将给智能机器带来更多的可能性。

强人工智能时代多模态交互技术的未来与展望

我们可以发现市场上正在逐渐出现一些新的声音:

智能空调通过语音交互结合机器视觉和传感器实现智能制冷;电视通过机器视觉识别照明和距离等环境因素来实现智能亮度。工业设备通过机器视觉辅助传感器或故障信号提高工业设备的安全性;

越来越多的多模态交互技术被应用到各种场景中,突破了传统的智能机器单点感知,实现了设备的多维感知和思维,使智能机器人性化和主动服务。

人工智能多模态交互技术已经成为人工智能交互的必然趋势。我们也期待火炬核心多模态交互平台ATS 3609D芯片能够应用于更多场景,赋予机器更强的智能属性,以更人性化的智能机器为每个人带来更好的服务。