AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；-OB体育app下载-OB体育app下载最新官网入口

　　欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

　　智谱AI发布GLM-4大模型，具有媲美GPT-4的中文能力，支持更长上下文、多模态能力，2024被称为AGI元年。

　　ResembleEnhance是一款令人印象深刻的语音处理技术，专为将嘈杂的音频转换为清晰有力的语音设计。

　　近日，智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream，能够将输入的文字描述转化为高质量和多视角一致性的3D资产。

　　元象发布全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。

　　来自南加州大学、哈佛大学等机构的研究团队最近提出了一项创新性的生成模型方法，名为DreamDistribution。这一方法基于提示学习，能够通过仅有的几张参照图片学习文本提示分。

　　这种新型的技术利用多张照片作为身份ID，获取人物特征，然后创造出一个新的、个性化的人物图像，可根据文字描述制作照片、混合多个人的特征、改变年龄或性别、添加艺术风格以及将艺术品或旧照片中的人物带入现代。

　　首席执行官萨姆·奥特曼最近在一次会议上表示，尽管GPT Store规定明文禁止，但新商店似乎正面临着内容管理问题。

　　阿里云表示，真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家下载正版通千问 APP，以保护自己的权益。

　　和偶像进行视频通话曾经是一种遥不可及的奢望，但如今这已经变成了一项有明确价格标签的服务。虚拟陪伴服务在在线平台上逐渐成为受欢迎的业务。

　　B站UP主“林亦LYi”近期引起了广泛关注，因其创办了一家全员AI的炒股公司，为其团队提供一笔资金用于真实炒股实验。然而，没想到的是，才刚开始，这些AI员工就“造反”了。

　　迈克菲推出的Deepfake音视频检测技术能准确识别AI伪造音视频，解决网络上音视频信息真假难辨的问题。

　　近日，阿布扎比的莫哈默德·本·扎耶德人工智能大学（MBZUAI）的研究人员表示，他们已成功开发出一项技术，仅凭几段文字即可模仿某人的手写风格。

　　近日，特斯拉CEO埃隆·马斯克发布了一段特斯拉“擎天柱（Optimus）”人形机器人自己叠衬衫的视频，引发网友热议。

　　华为诺亚方舟实验室开源了百万量级的GenImage数据集，帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具，致力于构建AIGC时代的ImageNet。

　　Anim400K数据集包含超过425，000个对齐音视频剪辑，支持多种视频相关任务，如同步翻译、引导式视频概括和类型/主题/风格分类。

　　近日，一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter，AI实现了在操作系统级别启动自身副本的雏形。

　　💡 通过开源项目OpenInterpreter，AI实现了在操作系统级别启动自身副本的雏形。

　　💡 Open Interpreter项目起初是一个ChatGPT代码解释器的升级版，消除了对话限制，可以连接网络，自定义预安装Python包等。

　　💡 团队引入了多模态版本的大模型，展示了AI在发送邮件、操作专业编曲软件等任务中的表现。