Voicebox 是一个开源的本地语音合成工作室,支持从几秒音频克隆声音,在23种语言中使用5种TTS引擎生成语音,应用后处理效果,并通过时间线编辑器创建多声音项目。所有模型和数据保存在本地,确保隐私,支持macOS、Windows和Linux平台。
Pixelle-Video 是一个开源工具,通过 AI 自动化生成短视频,包括智能文案创作、图片/视频生成、语音合成和背景音乐添加。支持多种 AI 模型和 ComfyUI 工作流,适用于无需剪辑经验的用户快速创作竖屏或横屏视频。
Inworld Portal 提供实时AI应用和语音代理的开发工具,包括顶级文本到语音(TTS)、运行时SDK和实时API,支持游戏、品牌和培训等领域的AI集成。

汇集影视、音乐、游戏、阅读、AI 等各类免费资源与工具的索引与指南。
SoulX-LiveAct 的官方推理代码仓库,提供用于实时长时人类动画生成的模型、推理脚本与演示。
多模态 AI 视频生成与编辑平台,支持9格图像到视频、首末帧控制、身份与声音一致性及基于指令的重创作。
基于 Seedance 2.0 的多模态 AI 视频生成器,支持文字/图片/音频/视频输入与参考编辑,提供导演级画面与原生音画同步。
面向印度 K‑12 及 JEE/NEET/CBSE/IGCSE 等考试的 AI 教育平台,提供个性化学习计划、题库练习、思维导图与音频课程。
面向中文用户的 AI 音乐创作社区与工具,支持无需乐理即可生成歌曲、上传分享与协作创作,适合音乐创作者与爱好者。
免费支持50+平台,一键提取视频/图片文案、音频转换与无水印下载,支持批量与多语种识别。
GodoAI 是一款支持本地化部署的办公 AI 产品,集模型下载、对话、知识库、图片生成与语音处理等功能于一体。
开源项目,使用 Web 技术构建,支持语音控制画布,实现互动音视频创作。
开源的 Web 音乐播放器,基于 JavaScript/Vue,支持本地与在线音频播放并提供可定制界面。

BibiGPT 开放 API(beta)文档,包含获取 API Token、总结、字幕、任务状态等接口说明与示例,提供 OpenAPI schema。
按用量付费的企业级AI平台,提供图像、视频、音频与语言模型API,一站式接入并支持私有化部署。
AI 一键总结音视频并支持对话,覆盖 B站、YouTube、播客与本地文件,快速生成章节大纲、思维导图与字幕,提升学习效率。
DataTool.vip 是一站式免费视频下载平台,支持 TikTok、Instagram、Twitter、Facebook 等,极速无水印,支持最高4K。

WEBM 转 MP4 转换器 — CloudConvert 提供免费且快速的在线文件转换服务。
Apple 官方中国网站,提供 Mac、iPhone、iPad、Watch、配件及技术支持的在线商店。
Cobalt 是基于浏览器的工具集合,需启用 JavaScript 才能完整使用。

AI驱动的视频工具:下载视频、去水印、提取音频与剪辑。
韩剧《机智的医生生活》特别版 OST 专辑页面,包含收录曲目、演唱者与制作/发行等详细信息。
tob-use 的 createAudio 接口说明,介绍如何创建与控制音频(播放、暂停、跳转、重播、销毁)及相关状态与方法示例。
QQ音乐是腾讯的移动音乐服务,提供海量在线试听、新歌首发、歌词、无损音乐、正版下载与MV观看。
基于 AI 的在线语音变声工具,支持实时或录音变声与多种音色切换。
基于毛玻璃设计的现代化响应式音乐播放器,支持桌面与移动端,具备音频可视化、主题切换与多语言支持。
Melodisco 是一个开源的 AI 驱动音乐播放器,提供在线演示、部署与本地开发说明,基于 TypeScript/Next.js 开发。