标签:模型

阿里云研发大规模音频语言模型Qwen-Audio

Qwen-Audio(Qwen Large Audio Language Model)是阿里云提出的大模型系列Qwen(简称统一前文)的多模态版本。Qwen-Audio 接受多种音频(人类语音、自然声音...

Stability AI 发布其最新的Stable Video Diffustion 视频开源模型

Stability AI 发布其最新的Stable Video Diffustion 视频开源模型!支持: - 文本到视频 - 图像到视频 - 14 或 25 帧,576 x 1024分辨率 - 多视图生成 -...

HeyGen实现流程中的语音克隆,现在有最佳开源方案了:XTTS v2

HeyGen实现流程中的语音克隆,现在有最佳开源方案了:XTTS v2,单样本即可克隆语音。现在已经能实现:让一个明星的采访视频,变成他讲述任意小故事(内容可以...

Drivable 3D Gaussian Avatars-Meta

Drivable 3D Gaussian Avatars-Meta Meta 发布了一种新的 3D 生成技术 D3GA,用高斯喷涂技术渲染的3D可控制人体模型。 之前的技术训练期间需要精确的3D标记,...

DeepMind 发布了一个音乐生成模型Lyria

DeepMind 发布了一个音乐生成模型Lyria DeepMind 发布了一个音乐生成模型Lyria,与其他模型不同的是这个模型不止可以生成音乐也可以生成搭配音乐的人声。同时...

LLaMA Factory 可让您轻松微调和训练大型语言模型 (LLM)

如果你正在寻找轻松微调和训练大型语言模型 (LLM) 的方法,你可能会对一个名为 LLaMA Factory 的新项目感兴趣。它结合了 LLaMA Board,这是一种用于训练和...

OpenAI CEO谈GPT-5透露微软加大投资计划

OpenAI CEO Sam Altman透露正积极寻求来自最大投资者Microsoft的进一步资金支持。公司CEO Sam Altman认为,这将推动他创造人工通用智能(AGI)—即与人类智能...

Animatediff 开始支持 SDXL 模型

Animatediff 开始支持 SDXL 模型 在测试LCM的时候突然发现Animatediff已经在前天开始支持SDXL了,尝试了一下效果确实比1.5好了非常多。就是太吃算力了。SDXL...

LCM Lora 模型发布大幅提升 SD 图片生成速度

LCM(Latent Consistency Models)这个技术,它可以让SD的图片生成速度提高5倍左右,但是存在的一个问题就是模型需要单独训练,无法兼容现有模型,这就导致无...

Aider AI 编码助手更新了新功能

如果您正在寻找 AI 编码助手,您可能有兴趣了解 Aider AI 结对编程工具的新功能和增强功能。这些新功能现在升级为 GPT-4 Turbo 模型,为 AI 编码助手以及它如...
1 3 4 5 6 7 21