创远信息技术服务 ©
登录    /    注册
为您提供技术支持
人声分离:对音频进行高质量的分离,分离出人声和背景音乐;
语音识别:把语音信号转变为相应的文本;
语音合成:将文本转化成拟人化语音;
证件照处理:批量更换证件照背景颜色;
文字识别:批量识别,快捷将书籍内容转文字。
建议在PC下使用本平台 http://wosoft.net
系统开发:王逊    电话:13698108416
 
为您提供技术支持
 
人声分离:对音频进行高质量的分离,分离出人声和背景音乐;
语音识别:把语音信号转变为相应的文本;
语音合成:将文本转化成拟人化语音;
证件照处理:批量更换证件照背景颜色;
文字识别:批量识别,快捷将书籍内容转文字。
系统开发:王逊    电话:13698108416
人声分离(消除噪音、提取背景音乐)
通过人工智能技术,对音视频进行高质量的分离,分离出人声和背景音乐。常用于人声消除、bgm提取、人声提取、伴奏提取、卡拉ok伴奏制作、视频转音频
应用场景:1.消除噪音,达到人声与噪音分离的目的;2.音频人声与背景音乐分离。

原始音频

人声音频

背景音频

证件照批量处理(换背景)
人像分割(Segment Portrait)基于人像分割算法,提供二分类人像分割、自定义人像分割等服务,支持识别图片中的人体轮廓,并将人像与背景进行分离,实现精细化抠图的效果,同时可以批处理100张照片。
应用场景:1.批量证件照(100张内)换背景颜色;2.人像抠图技术,复杂场景下发丝级抠图效果。

语音合成(文字转音频)
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求。目前支持男女共53种声音效果,可以满足小说、客服、导航、通知等多种应用场景。
应用场景:1.宣传片配音,提供风格稳重,字正腔圆的男女声主播;2.让富有感染力的声音给你讲故事、读小说,满足“懒人”的听书需求。

语音合成案例:创远信息技术服务为你提供语音合成服务,目前支持男女共53种声音效果,可以满足小说、客服、导航、通知等多种应用场景。
男声合成

女声合成

男童声音合成

文字识别
通用文字识别(General Optical Character Recognition,General OCR),提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别等多种服务,支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。。
应用场景:1.手写字识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别;2.用于图书馆,报社等针对图书、报纸、杂志等文字识别。

语音识别
语音识别(Automatic Speech Recognition,ASR) 通过音频文件,自动识别语音内容,并形成文本。对特定人语音识别系统的识别精度高。
应用场景:语音识别成文字,略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅。

需要识别的音频

识别结果

创远信息技术服务