人工智能报告

站内搜索
XR行业深度报告:身处人文与科技十字路口,开启空间计算时代

XR行业深度报告:身处人文与科技十字路口,开启空间计算时代

光学方案进一步确立,VR向Pancake,AR向光波导。Pancake光学方案具有轻薄/高成像质量/可调节屈光等优势,其核心思路是压缩屏幕与透镜之间距离,通过多片光学镜片让光路多次折返,扩大光路总长,使其可以达到合焦的同时扩大视场角,从而缩小整个光学模组总长。由于Pancake光学方案是组合透镜(单片式除外),可通过控制其中一片透镜进行屈光度调节(0-700°)。光波导通过全反射将光传输到眼睛前方再释放出来,可将显示屏和成像系统远离眼镜移到额头顶部或者侧面,这极大降低光学系统对外界视线的阻挡,并
电子行业HBM专题报告:AI的内存瓶颈,高壁垒高增速

电子行业HBM专题报告:AI的内存瓶颈,高壁垒高增速

HBM是限制当前算力卡性能的关键因素,海力士、三星、美光正加大研发投入和资本开支,大力扩产并快速迭代HBM,预计2024年HBM3e 24GB/36GB版本将量产/发布,内存性能进一步提高。HBM供需将持续紧俏,市场规模高速增长。通过分析生产工艺(TSV、键合等)和技术演进方向(先进制程、叠层),我们认为封装测试、前道和后道先进封装的设备和材料将是HBM主要受益方向。
人工智能行业专题报告:终端智能,人工智能AI的新革命

人工智能行业专题报告:终端智能,人工智能AI的新革命

基于成本、能耗、可靠性和时延、隐私、个性化服务等考虑,端云混合的 AI才是 AI 的未来,高通认为终端 AI 能力是赋能混合 AI 并让生成式 AI 实现全球规模化扩展的关键。百亿参数开源 MoE 大模型 Mixtral 8x7B 再掀热潮,性能超 LLaMA2-70B,对标 GPT-3.5。MoE(混合专家模型)通过将任务分配给对应的一组专家模型来提高模型的性能和效率。Mixtral 8x7B 的专家数量为 8 个,总参数量为 470 亿,但在推理过程中仅调用两个专家即只调用 130 亿参数。
Sora&ChatGPT与人工智能技术发展报告

Sora&ChatGPT与人工智能技术发展报告

OpenAI进一步推出了其文生视频的模型Sora,再次引起了轰动。Sora不仅支持最大支持60秒高保真视频生成,而且支持短视频前后扩展,即保持视频连续,并扩展时长。而就在不久前,RunWay、PiKa 还有Midjourney, 它们发布的文生视频模型仅支持2~3秒,即使这样他们的成功已经使我们感到震惊,因为就在我毕业的时候那是还是GAN模型大行其道。这次可以说,Sora硬生生的将RunWay、PiKa等采用Diffusion Model实现的文生视频模型按在地上进行摩擦。当前,视频广告、电商营
清华大学-AIGC发展研究资料2.0

清华大学-AIGC发展研究资料2.0

报告80%内容由AI自动生成,聚焦AIGC的多模态发展、多学科影响、全方位应用以及前沿探索,融汇了与AIGC相关的产业实践经验、学术研究探讨与社会理念摸索,致力于向读者提供全面了解AIGC动态的指南,共同探寻人工智能和人类未来发展的和谐之道。
OpenAI Sora专题报告:Transformer扩展优势凸显,视频理解与生成能力提升

OpenAI Sora专题报告:Transformer扩展优势凸显,视频理解与生成能力提升

从Sora模型看文生视频的技术路径:技术路径尚未收敛,Transformer扩展特性优势凸显。市场大多认为扩散模型是图像和视频生成领域的主流路径,但没有重视Transformer架构scale up的能力。OpenAI技术报告指出,Sora是基于扩散模型,但更强调,Sora是一个基于Transformer架构的扩散模型,其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前,为构建性能更优、效率更高的视频生成模型,已出现多种结合Diffusion Model和Transf
人工智能行业专题报告:从Sora看多模态大模型发展

人工智能行业专题报告:从Sora看多模态大模型发展

目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。
电子行业空间计算专题报告:Vision Pro开启空间计算时代

电子行业空间计算专题报告:Vision Pro开启空间计算时代

空间计算是指一组使人类能够在三维空间中与计算机进行交互的技术。在日常讨论中常与MR、扩展现实、沉浸技术等名词混用, 涵盖了人工智能、计算机视觉、虚拟现实、增强现实、传感器技术和自动驾驶等技术。“空间计算”的核心是要让机器具有深度感知功能,让数字世界正确地出现在我们身处的物理空间中。
加载更多