欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

  智谱AI发布GLM-4大模型,具有媲美GPT-4的中文能力,支持更长上下文、多模态能力,2024被称为AGI元年。

  ResembleEnhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音设计。

  近日,智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream,能够将输入的文字描述转化为高质量和多视角一致性的3D资产。

  元象发布全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。

  来自南加州大学、哈佛大学等机构的研究团队最近提出了一项创新性的生成模型方法,名为DreamDistribution。这一方法基于提示学习,能够通过仅有的几张参照图片学习文本提示分。

  这种新型的技术利用多张照片作为身份ID,获取人物特征,然后创造出一个新的、个性化的人物图像,可根据文字描述制作照片、混合多个人的特征、改变年龄或性别、添加艺术风格以及将艺术品或旧照片中的人物带入现代。

  首席执行官萨姆·奥特曼最近在一次会议上表示,尽管GPT Store规定明文禁止,但新商店似乎正面临着内容管理问题。

  阿里云表示,真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家下载正版通千问 APP,以保护自己的权益。

  和偶像进行视频通话曾经是一种遥不可及的奢望,但如今这已经变成了一项有明确价格标签的服务。虚拟陪伴服务在在线平台上逐渐成为受欢迎的业务。

  B站UP主“林亦LYi”近期引起了广泛关注,因其创办了一家全员AI的炒股公司,为其团队提供一笔资金用于真实炒股实验。然而,没想到的是,才刚开始,这些AI员工就“造反”了。

  迈克菲推出的Deepfake音视频检测技术能准确识别AI伪造音视频,解决网络上音视频信息真假难辨的问题。

  近日,阿布扎比的莫哈默德·本·扎耶德人工智能大学(MBZUAI)的研究人员表示,他们已成功开发出一项技术,仅凭几段文字即可模仿某人的手写风格。

  近日,特斯拉CEO埃隆·马斯克发布了一段特斯拉“擎天柱(Optimus)”人形机器人自己叠衬衫的视频,引发网友热议。

  华为诺亚方舟实验室开源了百万量级的GenImage数据集,帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具,致力于构建AIGC时代的ImageNet。

  Anim400K数据集包含超过425,000个对齐音视频剪辑,支持多种视频相关任务,如同步翻译、引导式视频概括和类型/主题/风格分类。

  近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter,AI实现了在操作系统级别启动自身副本的雏形。

  💡 通过开源项目OpenInterpreter,AI实现了在操作系统级别启动自身副本的雏形。

  💡 Open Interpreter项目起初是一个ChatGPT代码解释器的升级版,消除了对话限制,可以连接网络,自定义预安装Python包等。

  💡 团队引入了多模态版本的大模型,展示了AI在发送邮件、操作专业编曲软件等任务中的表现。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注