首页 范文大全 古典文学 职场知识 中国文学 公文书信 外国名著 寓言童话 百家讲坛 散文/诗歌 美文欣赏 礼仪知识 民俗风情
  • 工作总结
  • 工作计划
  • 心得体会
  • 竞聘演讲
  • 会议发言
  • 爱国演讲
  • 就职演说
  • 开业开幕
  • 思想学习
  • 征文演讲
  • 经验材料
  • 述职报告
  • 调研报告
  • 工作汇报
  • 年终总结
  • 申报材料
  • 学习体会
  • 企划方案
  • 活动方案
  • 技巧经验
  • 模板范例
  • 思想宣传
  • 经济工作
  • 工作报告
  • 组织人事
  • 反腐倡廉
  • 慰问贺电
  • 先进事迹
  • 思想汇报
  • 入党申请书
  • 党会发言
  • 先进性教育
  • 入团申请书
  • 个人简历
  • 演讲稿
  • 调查报告
  • 实习报告
  • 和谐社会
  • 观后感
  • 读后感
  • 作文范文
  • 自我鉴定
  • 讲话稿
  • 自查报告
  • 云创智能会议转写系统解决方案(用于会议场景)

    时间:2020-10-15 12:36:36 来源:蒲公英阅读网 本文已影响 蒲公英阅读网手机站

    相关热词搜索:转写 会议 场景

      智能会议转写系统 解决方案

     9 2019 年 年 3 3 月

     目录 需求背景 .............................................................................................................................................. 3 1 建设目标 .............................................................................................................................................. 3 2 技术方案 .............................................................................................................................................. 3 3 系统拓扑图 .......................................................................................................................................... 4 4 语音识别技术 ...................................................................................................................................... 9 5 系统功能 ............................................................................................................................................ 12 6 现场转录、实时投屏 ................................................................................................................. 12 6.1 音频转写 ..................................................................................................................................... 12 6.2 同步校正 ..................................................................................................................................... 12 6.3 个人词库 ..................................................................................................................................... 13 6.4 文本训练 ..................................................................................................................................... 13 6.5 语音输入,实时滚屏播放 ......................................................................................................... 13 6.6 系统价值 ............................................................................................................................................ 14 7 提升会议效率 ............................................................................................................................. 14 7.1 提升工作效率加快处理流程 ..................................................................................................... 14 7.2 提供智能分析结果 ..................................................................................................................... 14 7.3 提供后台管理功能 ..................................................................................................................... 14 7.4 提供智能化扩展功能 ................................................................................................................. 14 7.5

      需求背景

     1在各类会议中,需要形成文字版会议记录,便于事后追溯或跟踪。现有的人工听写方式受限于记录员的业务熟练程度和打字速度,记录效率较低。在会议中应用智能语音识别技术,能够将语音实时转成文字,会议结束即可成稿,可极大降低对记录员业务素质的要求,减轻记录员工作强度。

     会议过程中,会产生大量的文字及媒体文件,通过无纸化办公系统,可大量的节省会议资料的成本,使得会议的进行更加有效率。

     建设目标

     2按照“智慧、创新”的总体思路,充分运用云计算、大数据等智能化技术,围绕智能语音识别技术与会议场景的深度融合,将会议的全过程进行语音转写,对所得的电子记录数据进行有效的管理、分析、利用。全面推进会议向智能化方向发展。

     “智慧”:将智慧化发展理念与会议场景的实际需求相结合,通过智能语音识别技术替代会议记录人工录入,创新的将智能语音识别技术与会议场景进行深度融合,提高工作效率,解放速记员,将会议记录从“手动录入”向“自动录入”进行升级。

     “创新”:紧密围绕会议业务需求,积极探索基于大数据、人工智能等新技术的应用,实现信息化建设“技术创新”。

     全过程数字化:通过会场讲话实时转写或会议录音离线转写成电子文本化文件,实现会议记录全过程的数字化,确保会议记录的真实、完整。

      技术方案

     3云创智录系统基于内部专网上构建智能语音识别平台,提供语音识别基础支撑服务,并在此基础上构建云创智录系统。通过针对不同地区、不同种类会议的定制化语音识别模型和自定义关键词识别优化工具,可以有效提升对每次会议的语音识别准确率,为提升会议效率和工作效率提供强有力的技术支撑。

     系统采用私有云的形式进行部署,与外网实现物理隔离,保障数据的安全性。能实现会议中参会人员语录的实时自动分角色语音转写,并将转写结果实时展现在云创智录系统软件的管理界面上,以便于书记员同步查看和用词条修正的操作来校正转写出现错误的内容。会议录音在会议结束后自动保存在系统里,书记员

     也可以通过回听历史会议的录音记录来校对转写结果。

     系统拓扑图

     4网络版会议转录系统由服务器和会议室音频采集设备组成,能够支持多个会议室同时接入(支持扩容)。每个会议室需部署会议麦克风、音频处理器和高清音视频会议主机,例如:8 路音频处理器可以接入 8 个鹅颈式会议麦克风。会议秘书通过秘书电脑访问智能会议业务系统,控制会议的实时转写。麦克风到音频处理器之间传输距离支持 300m 以内,系统拓扑图如下图所示:

     上述硬件产品相关描述与介绍如下:

     产品名称 产品描述 音频处理器 功能描述:

     根据实际情况,提供 8 进 8 出型号,采用平衡式话筒\线路输入,以及裸线接口端子。主要为现场麦克风等拾音设备供电,以及提供混音功能,将模拟音频信号混音输出; 设备参数:

     无需光盘,设备自带安装软件; 120db 的 A/D 与 D/A 转换, 最高可达 96kHz/48K 采样率高速 DSP 处理芯片 Ti 450MHz FLOPS DSP 处理内核 输入源:输入方式可切换平衡话筒或线路,采用凤凰插接口; 量化位数:24bit; 采样率:48K

     幻像供电:DC 48V ; 频率响应:20~20KHz 总谐波失真+噪声:<0.002% @1KHz ,4dBu 数/模动态范围(A-计权):120dB 模/数动态范围(A-计权):120dB 输入阻抗(平衡式):20KΩ; 最大输出阻抗(平衡式):100Ω; 工作温度:0-40℃; 工作电源:AC110V-220V,50Hz/60Hz; 机箱尺寸:482*258*45(mm)); 电源功耗:<70W 运输重量:4Kg 尺寸(宽 x 深 x 高):483*250*44.5(mm) 通道隔离度:1kHz,100dB 输入共模抑制,60Hz,80dB 等效输入噪声 EIN(20-20kHz,A 计权).≤-131dBU 最大输出电平:+24dBu,平衡 最大输入电平:+24dBu,平衡 模拟输入至模拟输出系统延时:3ms 底噪(A-计权):-90dBu 高清音视频会议主机 功能描述:

     在会议场景中,主要接入上游输入的音频模拟信号,进行模/数转换,将数字音频信号输出给智能语音识别服务器供智能转写。

     设备参数:

     设备采用标准机柜式结构设计,主机厚度不得超过1U。

     设备内置 3 块 VFD 信息显示屏,实时显示光驱及硬盘刻录状态。

     设备支持 4 路高清视频输入,支持 SDI 或网络信号输入,具有 4 路 SDI 接口,同时具有 VGA、HDMI 输入接口;具有 HDMI 和 VGA 同时输出接口,分辨率均达到1920*1080,HDMI 与 VGA 可以同时输出相同合成画面,也可同时输出不同合成画面。

     设备可支持各通道单画面、画中画、三画面、四画面显示模式。

     设备视频编码采用 H.264,High Profile 的视频编码标准。

     单画面分辨率大于 704 像素×576 像素,传输码流大于等于 512Kbit/s,硬盘存储视频帧率大于等于25fps,应能实现讯问过程的网络直播、音文交互、讯问现场场景的选择。

     设备含有 2 路音频输入接口,音频编码采用 AAC 采样编码,同时含有 1 路以上(含 1 路)音频输出接口。

     设备脱离 PC 平台,采用嵌入式操作系统,集光盘刻录、视频显示、硬盘备份、网络传输等功能于一体,安全稳定、简单实用。

     设备内置双光驱,将录播现场的音像信息,实时同步直接刻录在光盘中。并且在刻录前自动格式化并检测光盘有效性,对不符合刻录要求的光盘自动弹出,刻录结束后自动封盘。

     设备内置 500G 硬盘,对录播现场的音像信息,实时同步备份,确保数据信息安全存储,同时支持外接移动硬盘进行实时同步刻录。

     设备采用双光驱,支持直刻支持,支持 4.7G 单层、单面双层 8.5G 实时刻录。使用标准 4.7G 容量 DVD 光盘,刻录时间 1 小时至 24 小时任选。

     设备具备更换光盘时视频时间不间断功能模式,第

     一光盘刻录完成后,重新放入第二张光盘,系统会把更换光盘时的录像刻录到第二张光盘内,实现前后两张光盘的视频时间不间断,双光盘刻录时支持无断点换盘模式,更换光盘时的录像不会丢失。

     设备支持哈希值计算,光盘停止刻录后即生成视频文件唯一哈希值,并写入光盘,可快速出盘,出盘时间不大于 1 分钟。

     设备内置高清录播采集模块,可以支持1280×1024、1920×1080 高分辨率,不低于 25 帧/秒的视频证据采集。

     设备支持合成画面 1920×1080,不低于 25 帧/秒高清分辨直刻。

     设备支持网页对设备工作状态监测,及控制刻录等。

     设备可设置定时录像,也可设定第一光驱刻录时间,第二光驱在第一光驱接近封盘时,自动启动刻录。

     设备支持音频信号模拟成动态的可视化图形,同步显示在视频画面中,可即时了解音频信息采集状态。

     设备可灵活调整显示内容的背景、颜色、位置、显示停留时间等。

     设备可以本机直接播放光盘视频,提供暂停,快进等功能。

     设备录制的视频为通用格式,通用播放器可以播放,方便录播示证使用。音视频单文件刻录存储确保光盘文件连续性,通用视频格式文件记录,可采用 QQ 影音,暴风影音 MEDIA PLAYER 等播放器播放。

     刻录光盘内置重点标记索引,在设备播放时,可以选择重点标记,设备会自动定位到录播中重点标记时间进行播放。

     设备可提供 WEB 服务,用户通过浏览器可远程同步实时观看录播现场场景,并可以和前端录播人员进行单

     向语音对讲。

     设备可防止在使用过程中因外界的影响造成录播同步刻录数据的丢失。意外断电重启后,无需更换光盘,以非硬盘导刻方式把原来的光盘恢复回来,保证光盘数据的可靠性。

     两台设备间,支持远程双向音视频通话,也可以通过 H.323 与视频会议终端进行音、视频通讯,实现录播功能。

     设备具有 2 路以上(含 2 路)USB2.0 接口,支持外接 USB 键盘输入中文,内置文字记录软件,可在设备上做简单文字记录,也可通过计算机网络访问设备,在远程WEB 界面做远程文字记录。

     设备具有 2 路以上(含 2 路)100Mbps/1000Mbps 自适应网口,支持网络拓展应用。

     智能语音识别服务器 功能描述:

     提供语音识别能力,将数字音频信号转写成文字,通过以太网线,将文本文字传至上层会议系统应用中展现; 同时提供会议系统服务,以及会议系统各项功能,详见 6.2 网络版会议转录系统功能介绍。

     推荐配置:(CPU 核心数依实际生产场景并发数确定)

     系统版本:centos6.7 硬件参数: CPU 类型:至强 lntel(R)Xeon(R) CPU 型号:Xeon D-1521 CPU 频率:2.40GHz CPU 核心:4 核心(8 线程)

     内存类型:DDR4 内存容量:128G(4*32GB 单条)

     硬盘接口:SATA3.0/M.2 硬盘容量:250GB SSD 网络接口:3 个千兆网口 USB 接口:USB3.0

     2 个 VGA 输出接口:

     1 个 电源类型:热插拨电源 电源数量:1 个 电源功率:400W 会议室内的麦克风输入的模拟信号声音通过声卡、高清音视频会议主机转换为数字信号,将音频最终输出到智能语音识别服务器上。

     在会议室原有的秘书电脑上通过智能会议转录系统控制会议语音转写,并对会议信息、会议记录进行编辑和管理。

     智能语音识别服务器负责将音频识别为文字,发送给秘书电脑上的客户端软件。

     会议秘书通过客户端软件可以实时查看、编辑、修改识别出的文字内容。

     会议参会人员可通过高清会议显示屏,查阅各类多媒体资料以及文档资料。

     语音识别技术

     5语音识别原理

     语音识别是机器通过分析和理解,将人类语音中的词汇内容转换为计算机可读的输入的过程,例如按键、二进制编码或者字符序列。典型的语音识别的框架,有三个重要的组成部分:模型训练、前端语音处理、后端识别处理。语音识别系统原理框图如下:

      图 10 语音识别技术原理图 功能特性

     语音识别支持 8k 和 16k 频率的多种音频格式。

     http 服务支持的语音格式如下表:

     音频格式

     备注

     pcm16K16bit

     16k16bit 录音数据, pcm8K16bit 8k16bit 录音数据 ulaw16K8bit

     16k8bit u-law 录音数据 ulaw8K8bit 8k8bit u-law 录音数据 alaw16K8bit

     16k8bit a-law 录音数据 alaw8K8bit 8k8bit a-law 录音数据 socket 服务支持的语音格式如下表:

     8K模型

     pcm8k16bit alaw8K ulaw8K vox6K4bit voc8K4bit GSM610 v36K4bit 16K K模pcm16K16bit

     型

     WebService 服务支持语音格式如下表:

     音频格式

     备注

     pcm8K16bit 8k16bit 录音数据 vox6K4bit 6k4bit vox 录音数据 vox8K4bit 8k4bit vox 录音数据 alaw8K8bit 8k8bit a-law 录音数据 ulaw8K8bit 8k8bit u-law 录音数据 GSM610 8K16bit 录音数据 pcm16K16bit 16k16bit 录音数据 v3 6K4bit 6K4bit v3 录音数据

      系统功能

     6 现场转录、实时投屏 6.1① 打开【语音转录】界面,单击右上角的【新建任务】按钮,跳转至任务创建界面; ② 选中【现场转录】后单击【确定】按钮,将跳转至【现场转录】界面; ③ 点击【添加角色】图标,在弹出的界面中依次添加对应的角色名称,点击确定即可; ④ 如需开启投屏,点击右侧顶部的【开启投屏】图标,即可在当前或其他屏幕上显示; ⑤ 点击【开始】按钮,开始进行语音的实时录入,同时在左侧编辑框中实时修改校正; ⑥ 转录完成时请单击【结束】按钮,界面将自动跳转至【同步校正】界面。

      音频转写 6.2① 打开【语音转录】界面,单击右上角的【新建任务】按钮,跳转至任务创建界面 ② 选 中 【 音 频 转 写 】

     后 单 击 【 上 传 音 频 】, 选 择 一 个 音 频 文 件(wma/wav/mp3/m4a/amr 格式),单击【确定】按钮后将跳转至【音频转写】界面; ③ 转录完成时界面将自动跳转至【同步校正】界面。

      同步校正 6.3① 单击【播放】按钮,进行录音的回听; ② 录音播放过程中,系统会对相应的文字内容进行底框标记; ③ 当遇到需要修改的文字,鼠标双击该处位置可直接修改编辑; ④ 文字修改完成后,单击下一处文字即可继续播放录音。

      个人词库 6.4① 点击【添加】按钮,弹出【添加】窗口; ② 输入【语音输入】和【文字输出】,点击【确定】,即添加成功。

     ③ 点击【导入】按钮,可以批量导入 txt 格式的文档。替换格式为:原始词语=替换词语。

      文本训练 6.5① 点击【导入文本】按钮,可多选批量导入 txt 文本; ② 选中文本后单击【开始训练】即可自动训练,直到完成。

     语音输入,实时滚屏播放 6.6双击桌面的快捷方式,运行【云创智能语音输入法】。运行之前,请连接好麦克风等语音采集设备,确保【语音输入】功能可以正常使用。

     单击桌面图标,当图标状态由【点击说话】切换为【请说话】时,可以进行语音的实时转写。

      使用快捷键【ctrl+/】可以讲输出锁定到当前输出界面,再次使用则推出锁定,锁定时,输入法主界面为高亮显示。

      字幕效果示意图 右键【桌面图标】或【托盘区图标】,点击选择【退出】即可退出系统。

     系统价值

     7 提升会议效率

     7.1系统能够将参会人员的发言自动实时识别成文字,让秘书的录入效率从以往最高每分钟输入 120~150 个字提升到当前每分钟输入 250~350 个字,平均大约能够缩短 1 倍的记录时长,大大减轻了秘书的工作压力;

     提升工作效率加快处理流程

     7.2系统能够做到整个会议过程全量信息的自动记录和保存,为后续的工作流程提供了客观公正的全面记录,对工作处理效率平均能够提升 20%;

     提供智能分析结果

     7.3系统为参会人员提供基于单通录音的智能分析结果,通过语音转写、自动分类、语义理解等多项技术组合出一系列的辅助工具,提高参会人员的会议效率、会议报告的准确率,同时提升会议结果的一致性、完整性;

     提供后台管理功能

     7.4系统为会议管理人员提供会议管理、系统操作员的管理。

     提供智能化扩展功能

     7.5会议系统底层采用全能智能能力平台,可以支持各种人工智能的技术的扩展,比如 OCR 图象识别(各种证件、票据、文本等),生物特征识别(声纹,指纹、人脸),智能翻译等。

    • 范文大全
    • 职场知识
    • 精美散文
    • 名著
    • 讲坛
    • 诗歌
    • 礼仪知识