标签云

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”
文章

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

阿里达摩院的研究人员提出了Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号,并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音/视频描述,写作,问答等。

阿里达摩院2023十大科技趋势:生成式AI、数字孪生等入选
文章

阿里达摩院2023十大科技趋势:生成式AI、数字孪生等入选

据Metaverse元宇宙报道,达摩院2023十大科技趋势发布,分别为:生成式AI、Chiplet模块化设计封装、多模态预训练大模型、存算一体、云原生安全、软硬融合云计算体系架构、端网融合的可预期网络、双引擎智能决策、计算光学成像、大规模城市...

24快报
JSON抓取失败