代码编织梦想

开源数字智能交互对话系统;通过图片生成高效肖像动画;在 azure 中一键部署知识图谱;开源chatgpt国内可用免费转发api_anole模型-爱代码爱编程

✨ 1: Digital Human Intelligent Dialogue System Linly-Talker是一个集成多种AI技术、支持图像和语音的智能交互对话系统。 Digital Human Int

开源tts模型支持中日韩并可以微调自己的声音模型;微软开源的知识图谱rag;rag和llms构建的搜索应用程序_fish speech linux-爱代码爱编程

✨ 1: Fish Speech Fish Speech 开源TTS模型支持中日韩,语音合成不止于自然 Fish Speech 是一个开源的语音生成项目,致力于开发和改进语音合成技术。项目最新稳定版本为1.1.2

阿里巴巴开源自然语音交互框架;在抱抱脸上使用liveportrait;58种提示技术的工具库_funaudiollm-爱代码爱编程

✨ 1: FunAudioLLM FunAudioLLM是一个为人类和大型语言模型(LLMs)之间自然语音交互打造的语音理解和生成基础框架。 FunAudioLLM 是阿里巴巴集团Tongyi SpeechTea

支持离线翻译任意语言的桌面应用程序;单张图像高效生成高质量的 3d 模型;2500种色彩映射的集合,适用于matplotlib和seaborn_comfyui-爱代码爱编程

✨ 1: Lingo Lingo是一款支持离线翻译任意语言的桌面应用程序 Lingo 是一款支持离线翻译的桌面应用程序,用户可以在不连接互联网的情况下进行多语言翻译。这款软件利用了Meta公司提供的nllb-20

claude sonnet使用react构建的开源macos风格桌面环境;新的sota视频风格化diffutoon;开源自动创建知识图谱和文档网络以提升rag性能_diffutoon安装-爱代码爱编程

✨ 1: macOS-Style React Desktop Environment MacAlverse 是一个用React构建的开源macOS风格桌面环境。 MacAlverse 是一个使用 React 构建

腾讯开源高质量人类运动视频的框架;通过音频指令修改图像;利用yolo分析网球视频;gemma-爱代码爱编程

✨ 1: MimicMotion MimicMotion 腾讯开源的通过姿态指导生成高质量任意长度人类运动视频的框架 MimicMotion 是一种可控视频生成框架,旨在生成高质量的任意长度人物动作视频,采用带有

谷歌 i/o 2024大会全面硬钢openai;腾讯宣布旗下的混元文生图大模型;阿里巴巴技术下的ai自动视频剪辑工具_混元dit 本地部署-爱代码爱编程

✨ 1: 谷歌 I/O 2024 谷歌 I/O 2024 发布了众多新技术,包括 Gemini AI、大语言模型和通用 AI 智能体等,全面颠覆搜索体验。 谷歌 I/O 2024发布会带来许多令人兴奋的新功能和技

开源 复刻gpt-爱代码爱编程

✨ 1: Moshi 法国 AI 实验室 Kyutai 刚刚推出了开源 复刻GPT-4o - Moshi Moshi是一款现代化聊天平台,旨在提供用户友好和高效的即时通讯体验。它整合了多种功能,包括文本消息、语音

吴恩达老师开源翻译工作流agent;阿里巴巴开源无需训练即可使用参考图像编辑图像的工具;whisper web 浏览器字幕生成_translation agent-爱代码爱编程

✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其

抱抱脸上第一的开原模型qwen2-爱代码爱编程

✨ 1: Qwen2 Qwen2 是一种多语言预训练和指令调优的语言模型,支持128K上下文长度并在多项基准测试中表现优异。 Qwen2(全称“Qwen Qwen”,简称Qwen)是一个先进的大语言模型家族,在其

ai新工具(20240125) 孟子gpt大模型开放公众服务;红薯智语-爱代码爱编程

孟子GPT大模型开放公众服务 澜舟科技的孟子大模型是一款功能强大的生成式可控大语言模型。它能够通过多轮对话,帮助用户在特定场景中完成各种工作任务,包括知识问答、通用写作、多语言翻译、金融场景和编程等任务。在此次对外开放中,

开源的代码语言模型deepseek-爱代码爱编程

✨ 1: DeepSeek-Coder-V2 开源的多专家代码语言模型,支持338种编程语言。 DeepSeek-Coder-V2 是一个开源的代码语言模型,专为代码生成、代码补全、代码修复以及数学推理等任务而设

用chattts 朗读《我的阿勒泰》里面的文章《我所能带给你们的事物》_chattts 小说-爱代码爱编程

最近开源的ChatTTS十分的火爆,而且效果非常不错,普通的个人电脑就能跑得动,总是想拿它来做点什么,顺便看看效果是不是像网上说的那么理想。刚好最近《我的阿勒泰》也比较火爆,用它来朗读朗读李娟的文字看看效果如何? 那就开始

在无gpu的windows上运行chattts_chat tts no gpu found-爱代码爱编程

如果你在安装的过程中出现了下面的错误,不妨先看看这些安装步骤: cl: 命令行 error D8021 :无效的数值参数“/Wno-register” error: command 'C:\ windows ERROR:

ai新工具(20240301) ideogram; image to music generator等_ai image to music generator-爱代码爱编程

1: Ideogram 全新的多模态生图AI工具,以其优秀的文字渲染能力和生图能力受到业界瞩目 Ideogram是一个创新的AI工具,它通过在生成的图片中自然地整合文字,解决了生图AI领域长期存在的一个难题。这个

stability ai开源文本到音频生成模型;字节跳动强大的tts;可在手机上部署的多模态大模型;小爱音箱接入gpt_字节开源tts-爱代码爱编程

✨ 1: Stable Audio Open Stable Audio Open是一个开源的文本到音频生成模型,可生成长达47秒的音频样本和音效。 Stable Audio Open 是由Stability AI发

ai 可穿戴设备insight;cohere command r 免费体验地址;马斯克多模态模型grok-爱代码爱编程

✨ 1: Udio Udio是一款新型AI音乐生成器,能够根据需求合成逼真的音乐。 Udio是一个由前DeepMind员工启动的新型AI音乐合成服务,它可以根据文字提示(包括用户提供的歌词)创建全新的高保真音乐音

ai新工具(20240122)whisper speech-爱代码爱编程

Whisper Speech-开源文本转语音系统 Whisper Speech是一个开源的文本到语音系统,使用了Whisper和EnCodec等开源模型来生成语义标记和执行语音建模。目前,WhisperSpeech的模型是

ai工具推荐:开源tts(文本生成语音)模型集合_ai语音开源csdn-爱代码爱编程

XTTS TTS是一个语音生成模型,可以通过一个简短的6秒音频片段将声音克隆到不同的语言。它不需要大量的训练数据,也不需要耗费大量时间。TTS支持17种语言,可以进行声音克隆、情感和风格转移、跨语言声音克隆以及多语言语

ai新工具(20240222)sdxl-爱代码爱编程

SDXL-Lightning - 节跳动开发一个快速的文本到图像生成模型 SDXL-Lightning是字节跳动开发一个快速的文本到图像生成模型,能够在几个步骤内生成高质量的1024像素图像。该模型发布用于研究目的,可以从