人工智能报告

站内搜索
清华大学-AIGC发展研究资料2.0

清华大学-AIGC发展研究资料2.0

报告80%内容由AI自动生成,聚焦AIGC的多模态发展、多学科影响、全方位应用以及前沿探索,融汇了与AIGC相关的产业实践经验、学术研究探讨与社会理念摸索,致力于向读者提供全面了解AIGC动态的指南,共同探寻人工智能和人类未来发展的和谐之道。
OpenAI Sora专题报告:Transformer扩展优势凸显,视频理解与生成能力提升

OpenAI Sora专题报告:Transformer扩展优势凸显,视频理解与生成能力提升

从Sora模型看文生视频的技术路径:技术路径尚未收敛,Transformer扩展特性优势凸显。市场大多认为扩散模型是图像和视频生成领域的主流路径,但没有重视Transformer架构scale up的能力。OpenAI技术报告指出,Sora是基于扩散模型,但更强调,Sora是一个基于Transformer架构的扩散模型,其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前,为构建性能更优、效率更高的视频生成模型,已出现多种结合Diffusion Model和Transf
人工智能行业专题报告:从Sora看多模态大模型发展

人工智能行业专题报告:从Sora看多模态大模型发展

目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。
电子行业空间计算专题报告:Vision Pro开启空间计算时代

电子行业空间计算专题报告:Vision Pro开启空间计算时代

空间计算是指一组使人类能够在三维空间中与计算机进行交互的技术。在日常讨论中常与MR、扩展现实、沉浸技术等名词混用, 涵盖了人工智能、计算机视觉、虚拟现实、增强现实、传感器技术和自动驾驶等技术。“空间计算”的核心是要让机器具有深度感知功能,让数字世界正确地出现在我们身处的物理空间中。
人工智能行业专题分析:多模态,AI大模型新一轮革命

人工智能行业专题分析:多模态,AI大模型新一轮革命

相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现的更加智能,能够执行更大范围的任务,有望成为人类智能助手,推动 AI 迈向 AGI。就技术架构而言,多模态技术可拆解为编码、对齐、解码与微调等步骤,逐步挖掘多模态关联信息,输出目标结果。文生图 CLIP 模型为最先成熟的多模态技术,目前,多模态已不再局限于图文两层信息。例如,Meta-Transformer 可同时理解并处理 12 种模态信息。
前沿人工智能行业安全的最佳实践:面向中国机构的研发实践案例与政策制定指南

前沿人工智能行业安全的最佳实践:面向中国机构的研发实践案例与政策制定指南

GPT-4 等前沿大模型展现出强大的涌现能力,在多领域逼近人类水平。同时,大模型为多个技术方向带来新的发展空间,包括多模态、自主智能体、科学发现等能力。模型能力在未几年内仍存在数量级进步的空间。Inflection在未来18个月内将使用比当前前沿模型GPT-4 大100倍的计算量。Anthropic预计在未来的5年里用于训练最大模型的计算量将增加约1000倍。由于大模型的涌现能力,这些更先进人工智能系统所带来的机遇和风险具有巨大不确定性。
AIGC行业专题报告:Sora算力倍增,国产架构+生态崛起

AIGC行业专题报告:Sora算力倍增,国产架构+生态崛起

全球算力架构升级战已打响。英伟达架构持续升级,升级迭代速度明显加快,平均两年架构升级,我们判断目的是维持在GPU霸主地位, 根据新浪财经报道,B100将于2024年第三季度开始量产,部分早期样品将于明年第二季度出货。 而我们认为英伟达Tensor Core专为AI而生,目前其Hopper架构已经为第四代,Hopper架构超强性能,可加速所有精度,性能领先,应用广泛,我们判断其广泛应用于训练市场。AMD奋起直追,欲挑战英伟达龙头地位,第三代Instinct MI300系列性能优异,满足生成式AI强
加载更多