Mialrr Speaker Recognition Save

声纹识别(Voiceprint Recognition, VPR)，也称为说话人识别(Speaker Recognition)，有两类，即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)

Project README

Speaker-Recognition

声纹识别(Voiceprint Recognition, VPR)，也称为说话人识别(Speaker Recognition)，有两类，即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)

speech-demo

项目地址：https://github.com/mialrr/Speaker-Recognition

文档地址：

声纹识别：
语音识别：
语音合成：
目前AppID，APIKey，SecretKey是共用的等待官网开发完成自己申请就可以

简介

Rest API 接口为http 访问，任意操作系统，任意语言，只要能对域名或者IP地址发起http请求的，均可以使用。
以JAVA PHP python C BASH 作为示例，展示rest api的调用过程，选择一个运行即可。
支持音频格式：wav、flac
音频编码要求：采样率 16000，16bit 位深，单声道（音频格式查看及转换）声纹识别长度不要超过10毫秒
返回识别结果：识别结果会即刻返回，采用 JSON 格式封装

目录结构

+--rest-api-spk 声纹识别rest api
/-- shell 脚本
/-- java 代码
/-- C 代码
/-- php 代码
/-- python 代码
/-- C# 代码
/-- Ruby 代码
+-- sample-files 语音识别示例音频文件

项目进度：

☑ spk声纹识别（acc 99.6%, i7-9700K(5Ghz) M40下10毫秒）
☑ asr语音识别（acc 90.9%, i7-9700K(5Ghz) 1秒）（开发语音识别主要是为了声纹认证本地部署需要）极度缺少训练样本）
☒ tts语音合成

请求

对于贡献大批量可用（开源数据不算）训练样本的兄弟，我们可以给您线下免费部署一次完整服务

客户场景

已在一家支付公司使用（支付场景）

谢谢各位

weixin:13165984330

#说明

目前公网的API接口刚刚开发还有些问题，随着开发进行会一一处理掉，这几天测试的兄弟不要太激动，如有问题直接在github上提问就行
如需部署私有云（好处就是不会泄露用户隐私）可以直接微信咨询

#参考 Postman

Postman简单调用

Open Source Agenda is not affiliated with "Mialrr Speaker Recognition" Project. README Source: mialrr/Speaker-Recognition

Stars

Open Issues

Last Commit

4 years ago

Repository

mialrr/Speaker-Recognition

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/mialrr-speaker-recognition"><img src="https://www.opensourceagenda.com/projects/mialrr-speaker-recognition/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022