首页 范文大全 古典文学 职场知识 中国文学 公文书信 外国名著 寓言童话 百家讲坛 散文/诗歌 美文欣赏 礼仪知识 民俗风情
  • 范文大全
  • 古典文学
  • 职场知识
  • 中国文学
  • 公文书信
  • 外国名著
  • 寓言童话
  • 百家讲坛
  • 散文/诗歌
  • 美文欣赏
  • 礼仪知识
  • 民俗风情
  • 谜语大全
  • 名言警句
  • 天河区科技项目可行性报告

    时间:2020-10-16 05:03:12 来源:蒲公英阅读网 本文已影响 蒲公英阅读网手机站

    相关热词搜索:天河 可行性报告 项目

     2012 年 年 天河区 科技计划项目

     可行性报告

      项目名称:

     智能化视频检索与处理系统

     主要技术领域:

     计算机图形图像处理

     计算机视觉及应用

     语音处理

     模式识别

     关键字:

     语义视频检索

     多模式视频信息处理

     视频加密

     自动场景切割

     台标定位

     音 语音 DNA 特写镜头慢速播放

     水印技术

     申请单位:

     XXX

     目录

     一. 项目申请的必要性

     …………………………………………………………2 1. 项目的重要意义………………………………………………………2 2. 项目与天河区重点发展技术领域的符合程度………………………3 3. 技术的先进性与创新性………………………………………………3 4. 技术在本领域的关键程度……………………………………………4 5. 项目所研究技术的行业推动作用……………………………………4

     二. 承担单位情况…………………………………………………………………5 1. 承担单位基本情况……………………………………………………5 2. 研究开发能力…………………………………………………………5 3. 财务、经济状况………………………………………………………6 4. 承担单位的科研及生产经营管理状况………………………………7

     三. 项目实施方案…………………………………………………………………7 1.项目的目标、研究范围和主要内容…………………………………7 2.项目的技术方案………………………………………………………8 3.项目的阶段与进度……………………………………………………13 4.资金筹措及使用………………………………………………………13

     四. 经济及社会效益分析…………………………………………………………16 1.市场分析………………………………………………………………16 2.经济及社会效益分析…………………………………………………19

     五. 风险分析………………………………………………………………………24 1.技术人员风险…………………………………………………………24 2.资金风险………………………………………………………………24

     六. 附表……………………………………………………………………………26

     七.

     附件

     一﹑项目申请的必要性

     1. 项目的重要意义

     随着信息技术和网络技术的发展,引发社会对信息化服务更高的要求和服务需求,随着通讯带宽技术的不断发展,视频技术以其信息容量大、事物表达形象化的特点,越来越受到人们的重视。今后,社会的发展将会以多媒体为中心,通过将图像、语音及文字信息有机整合,产生更直观生动、更容易使用户接受的信息存在形式。在具备了大量的视频多媒体信息之后,多媒体数据库的有效管理,按需进行视频内容检索和处理,就成为了急需解决的关键问题。

     智能化视频检索与处理系统运用在计算机图形图像学﹑计算机视觉﹑语音处理及人工智能方面先进的学术研究成果,通过开发具有自主知识产权的多模式视频信息处理核心技术, 对包含在视频信息中的图像﹑语音及文字等信息进行综合分析判断,提供基于内容的智能视频检索手段,并对索引出的视频段按需进行加工处理,从而推动数字化多媒体技术应用到更多领域,使他们效率更高,工作更智能。

     声像信息以数字形式存储和传播,为人们更灵活使用这些信息提供了可能性。但随之而来的问题是,随着网络上信息爆炸性的增长,获取到我们感兴趣的信息的难度越来越大。传统的基于关键词或文件名的检索方法显然不适用于数据量庞大﹑又不具备天然结构的声像信息,比如“在这段新闻片中找出有胡锦涛主席讲话和有胡锦涛主席出现的镜头片段”,这种形式的检索是传统检索方法难以胜任的工作。基于视频内容的智能化检索技术是解决这一难题的有效方法。

     1993 年 12 月,英国计算机学会在英国 Leeds 大学举行了多媒体系统和应用( Multimedia System and Application )

     国 际 会 议 。

     英 国 Michael D •Vislon(Rutherford Appleton Laboratory)在会上作了关于建立多智能多媒体系统的报告,明确提出了研究智能多媒体技术问题。近年来,美国,日本等国在该领域投入了大量的人力和物力,取得了一些卓有成效的成果和专利。我国在该领域的起步较早,许多大专院校和研究所以及许多从事媒体方面研究的公司在多媒体研究方面都倾注了大量的心血,取得了丰硕的理论研究成果,但限于经费和体制,自主开发的主流产品较少。本项目所自主研发的智能化视频检索和处理系统正是要解决这一问题。

     基于内容的视频资料数字智能化管理系统是一个当前快速发展的多学科交叉研究领域。通过对视频内容的智能分析,能够产生出不断增加的,涉及到社会生活各个领域的应用前景,包括电视媒体应用﹑互联网智能检索﹑音像资料库管理﹑反恐监控系统﹑司法领域﹑展馆多媒体运营系统﹑体育训练和赛事辅助系统﹑远程教学﹑电子商务﹑视频游戏以及有线和无线通信服务等等。同时,视频内容智能分析上的技术进步,可以促使很多相关领域例如信号处理﹑计算机视觉﹑模式识别和多媒体数据库管理等方面的技术进步。

      我们所自主研发的智能化视频检索和处理系统涉及到图像识别处理﹑语音识别处理﹑文字识别处理﹑机器学习以及模式识别等方面的内容,其中场景的自动切割﹑台标定位﹑语音 DNA 处理﹑特写镜头慢速播放及视频加密等核心技术又成为项目内容的关键。一些核心技术本身的研发也有着重要意义和广泛的应用前景。

     语音 DNA 识别可应用于新闻节目自动标注,基于特定人的语音文档的检索,说话者的验证和自动跟踪,以及语音数据库的自动生成和索引。随着信息时代的发展,用于标志各人身份的ID代码使用非常广泛,比如各种购物卡、信用卡、长途电话卡和证券电话委托服务等。这类卡或服务均具有数字、字符串形式的电子帐户与电子密码。若电子帐户及密码失密,将会造成用户不可估量的经济损失。以提取说话人声音特征为手段的语音 DNA 识别技术,则可以将密码失密造成的损失降到最低。一方面,语音识别可识别用户说出的数字代码,向用户提供自然便利的接口界面,另一方面,说话人识别将用户本人固有的发音特性运用于身份核查,提供了更安全的保护,即使他人窃取了密码,也会因为其发音的特征不同而被拒绝。目前,语音 DNA 技术被应用到说话人核对、声控电子密码锁、罪犯确认、医学中患者确认以及军事等领域。随着现代企业自动化和安全化要求的提高,语音DNA 识别系统也逐步应用到到工厂中。为了工厂运行的安全,防止无权限人员进入控制系统现场,必须要进行身份确认。同时,夜间无人值守的自动化工厂系统在响应用户进行的远程操作前,也必须要进行身份确认。

     数字水印技术是上世纪 90 年代中后期发展起来的新兴学科。随着多媒体技术和网络技术的迅速发展与广泛应用,大量的数据可以方便、高效地进行传输,与此同时,对于防止网上侵权行为、资源所有人的身份确认等问题提出了更高的要求。传统的加密技术已经不足以解决新出现的问题,数字水印技术的产生,在这方面显示出了巨大的潜力,并且在版权的认定与保护﹑加指纹﹑标题与注释﹑篡改提示及使用控制等方面展现了良好的应用前景。国内在这方面的研究相对滞后些,而作为我们智能化视频检索和处理系统的核心组成部分,水印加密技术的研发有着其重要的意义。

     2. 项目与天河区重点发展技术领域的符合程度

      智能化视频检索和处理系统以场景自动切割﹑台标定位﹑语音 DNA 识别﹑特写镜头慢速播放及视频加密等技术为核心,以计算机图形图像学﹑计算机视觉﹑语音处理﹑数据库技术及信息安全技术为主要研究领域,这些都完全符合天河区在计算机图形与图像技术、计算机软件与网络技术方面的重点发展方向,具有重要的发展意义和良好的应用前景。

     3. 技术的先进性与创新性

     智能化的视频信息检索与处理是一个全新的研究领域,是对传统多媒体信息

     管理的全面挑战。我们的系统在原理上和应用上都有很大的创新之处。相对于以文件存贮目录为主要存在形式的传统方式,以视频内容语义概念进行检索的工作模式,使内容提取更直接,更符合用户要求。传统的多媒体信息管理需要借助人力的辅助,才能完成相对个性化的,以用户需求为概念的视频信息查询,而智能化内容检索全部由系统自动完成,而且查询结果与需求直接匹配,简洁高效。

     基于查询结果按内容分类的视频流的特性,智能化检索与处理系统还可以进而进行方便的特殊功能处理,例如场景缩放,特写镜头的慢速播放等等。考虑到搜索结果安全发布的问题,我们的系统还可以对索引视频段进行水印加密,有效防止盗版篡改等行为的发生。而所有这些功能都是传统多媒体管理方式没有实现,技术上也无法实现的。

     我们智能视频检索与处理系统的核心技术也有其本身的先进创新性。在原理上,我们在国内工业界首次提出了综合图象﹑语音和文字识别技术的多模式综合信息处理方式,用于智能化的视频检索标引。在图象放大问题上,通过自主开发的超线性算法,有效的解决了模糊化和纹理方向改变的问题。在慢速回放问题上,通过研发新型的运动补偿内插算法,在充分利用图像信号的帧间相关性的同时,还充分利用其帧内相关性,将运动估值与图像分割有机地结合起来,既刻画出它们之间的相互依赖性,又采用了恰当的解藕处理,从而改进了图像质量。在语音DNA识别技术方面,我们系统有效解决了对不同语种﹑不同方言的语音识别问题,在水印加密方面,通过采用基于离散余弦变换和小波变换的一组高效的水印嵌入和盲检测方法,在不完全解码的情况下快速实现水印的嵌入和检测,同时实现了鲁棒性好和不可见性的特点。系统的主要创新点如下:

      多种特征参数作为判决依据,可以提高系统判决的可靠性、鲁棒性和分辨能力,克服由于语音信号变异性所导致的话者特征空间移动而带来的判决的不确定性;  针对语音检索和标引系统的特点,对背景噪声中的有用信息进行分析和利用;  采用改进的径向基函数(RBF)网络,如椭圆基函数(EBF)网络,对话者特征的描述性更好,识别率高;  基于支持向量机的人脸模式分类方法在小样本训练的前提下具有较强的非线性分类能力和学习能力。

     4. 技术在本领域的关键程度

     在网络和数字化进程不断深入的过程中,多媒体数字资产的拥有者对有效管理和充分利用这些资源提出了全新的要求。只有当多媒体视频信息以内容为基础,以事件为中心进行管理和检索,数字化多媒体资产智能化管理的实现才能够成为可能,也才能够进一步推动相关产业和应用领域在此基础上进一步发展,而智能化视频检索与处理系统是实现这一目标的技术关键,在此基础上将可以发展出广阔的应用前景。XXX 公司作为专门从事数字视频应用和信息安全的软件开发及技术咨询服务企业,通过多年与探索和实践,深刻认识到了开发此项目的必要性和迫切性。

     5. 项目所研究技术的行业推动作用

     通过开发具有自主知识产权的智能化视频检索和处理系统,可以带动多媒体信息管理,电视媒体资产管理等行业技术革新,促进劳动生产率的提高,进一步提高行业本身的竞争力,满足用户数字时代个性化的需求。开发所涉及到的技术创新又可以促使很多相关领域例如信号处理﹑计算机视觉﹑模式识别和多媒体应用等方面的技术进步。

     二﹑承担单位情况

     1.承担单位基本情况 XXX 成立于 2000 年 3 月,是由美国 XXX 公司与广州市政府共同投资兴办的留学生企业,注册资金 1928 万元人民币。其中,DISTINCTIVE

     TECHNOLGY

     LIMITED 占 78%。广州市科技风险投资公司占 22%。专门从事数字视频技术应用和电视台媒体资产管理软件开发。

     公司拥有一批充满朝气的经营管理者和富有才华的高技术人才,追求“创建一流企业、造就一流人才、开发一流产品、提供一流服务”的企业目标,倡导开拓创新、追求卓越、优质服务、规范管理的企业理念。

     2.研究开发能力 毕业于美国、新加坡和中国的 6 位博士和 19 硕士,构成了公司研究开发的核心力量。

     与上海大学和华中理工大学等国内高校联合组建的研究中心,为公司提供了多方位的技术支持。

     总部设在美国,使公司能够及时跟踪国际上的前沿技术。

     多项拥有自主产权的关键技术,确立了公司雄厚的技术基础。

     自有技术:

      《基于ADM的信息存储与检索系统》

      《实时体育比赛标引与素材管理系统》

      《基于内容的电视台多媒体数字化管理系统》 前期成果情况:

      前期成果《实时体育比赛数字化素材管理系统》已获得国家科技部“科技型中小企业技术创新基金”立项。

      《实时体育比赛数字化素材管理系统》列入 2003 年度广东省技术创新项目计划(第二批)。

      前期成果《实时体育比赛数字化素材管理系统》已在上海电视台应用。

      前期成果已有国外实施案例:美国 NBA 联盟、美国 MLB 联盟(大棒球联盟)。

     项目负责人简历 陈宝辉

     年龄:4 42 2 学历:硕士 专业:机械工程

     主要经历:毕业于华中理工大学,88年赴美国留学,获得美国纽约市立大学机械工程硕士学位。毕业后曾在纽约市立大学任计算中心主任,负责规划、设计和组建纽约市立大学(City College of

     New York

     CCNY)计算机网络,是第一批开始进行互连网工作的开拓者。曾在美国道琼斯Dow Jones & Company任高级系统管理员,管理该公司的计算机内部和外部(互连网)网络;曾在美国美林证券Merrill Lynch & Company公司任副总裁助理,负责设计和管理公司DMZs及防火墙系统;曾在美国ING Barings 公司任副总裁,负责公司全球信息安全系统。

     99年陈宝辉先生在美国新泽西州创立了XXX Systems, Inc.公司,从事国际化的软件开发工程,陈宝辉先生在公司担任CEO职务。2000年回国考察市场后,他将美国XXX的中国总部设在广州,并先后建立北京办事处、上海办事处和西安研发中心。

     陈宝辉先生负责公司全球化的战略计划、资本运作及业务管理和运行。通过他的管理与经营,XXX公司已经成功地将业务从E-LEARNING软件开发扩展到数字化的基于内容的视频技术管理与软件工程的开发。

     技术专长:软件开发和企业管理 主要工作业绩:

     主持了美国摩根财团全球计算机网络安全性和保密性的评估。报告对 JP Morgan全球网络的保密性和安全性进行了全面的、具体的评估,对改进JP Morgan网络提出了多种可行的改进意见,并得到了 JP Morgan 网络工程委员会的好评。

     主持了美国摩根财团(JP. Morgan)VPN(Virtual Private Network)的设计和安装。这对改善 JP Morgan 网络的安全性和可用性有很大的帮助.该项目

     已经开始在美国,欧洲及亚洲进行试运行。

     主持了美国 Lehman Brothers 计算机网络的审查和评估。对 Lehman Brothers 网络的弱点及不足之处提出了建设性的意见,审查和评估报告已交公司执行委员会进行实施,此报告发表在 Lehman Brother Network,日期为 2000年 5 月。

     主持设计了美国大的制药商(世界第四大)Bristol Myers-Squibb 的 VPN网络和个人上网络联接。

     主持评估了美国道琼斯(Dow Jones)和英国路透社(Reuters)Internet网络站设计的安全性及可靠性。

     主持设计了美国 PERSHING(美国最大的股票交接公司)的 DNS

     DHCP的总体结构。

     主要承担人员 姓名 学历 所学专业 职务 备注 伍行健 博士 应用力学 技术总监

     刘昉 博士 计算机应用 研发部经理

     高健 博士 系统工程 项目经理

     何南忠 硕士 计算机图像处理 研发人员

     王以治 硕士 数学和软件技术 研发人员

     陈宝辉 硕士 机械工程 总经理/技术统筹

     郭毅怡 硕士 计算机应用 高级工程师

     武卫 本科 计算机应用 研发人员

     杨继平 本科 计算机应用 质量部经理

      3.财务、经济状况

     (1)历史财务 公司目前的财务指标为(2 2002 年)

     项目 数量 资本金合计 1380.68 万元

     资产总额 1556.68 万元 流动资产总额 603.38 万元 流动负债总额 23.63 万元 固定资产总额 137.18 万元 固定资产净值 100.69 万元 资产负债率 8.68% 销售收入 万元 总成本 万元 销售税金及附加 万元 实现利润 万元 所得税 0 万元 净利润 万元 4.承担单位的科研及生产经营管理状况 核心管理人员曾留学美国并长期在国际知名企业任职,如美国道琼斯、ING霸菱、美林证券、美国摩根财团和野村证券等,切身体验并掌握了西方先进的管理理念和方法,结合中国市场的特点,形成了专业而科学的管理风格。

     公司高层管理人员中,三分之二具有硕士以上学位,包括 MBA,先进的管理理念、国际化的管理经验、科学的组织结构,构成了公司质量体系的基础,而ISO9000 质量认证体系在保障高效率的同时,更是完善质量控制的保证。

     三﹑项目实施方案 1. 项目的目标﹑研究范围和主要内容 (1)项目目标的确定及其主要依据 通过开发具有自主知识产权的多模式视频信息处理核心技术, 提供基于内容的智能视频检索手段,并对索引出的视频段进行加密处理,从而推动基于内容的数字化多媒体技术应用到更多领域,使他们效率更高,工作更智能。

     随着数字和网络技术的进步,视频信息不断增多,并且由于其特有的直观性和易交互性,对于视频内容的分析﹑掌握和处理正变的越来越重要。通过对视频内容的有效智能检索,可以实现基于个人需求的视频服务,并且在此基础上使其在电视媒体应用﹑互联网智能检索﹑音像资料库管理﹑反恐监控系统﹑司法领域﹑展馆多媒体运营系统﹑体育训练和赛事辅助系统 ﹑ 远程教学 ﹑ 电子商务﹑视频游戏以及有线和无线通信服务等涉及到社会生活各方面内容的领域里得到更深入有效的应用。

     (2)项目范围的选择及其主要依据 为了深入分析视频内容,准确把握视频信息中所发生的事件,以及处理和加密后续的视频产品,本系统需要包括图像识别处理﹑语音识别处理﹑文字识别处理﹑机器学习以及模式识别等内容。其中场景的自动切割﹑台标定位﹑语音关键词识别﹑语音 DNA 处理﹑特写镜头慢速播放及视频加密等核心技术是关键的内容。

     通过这些简洁高效的自动分析,蕴涵在海量流媒体里的内容事件信息就可以

     以简洁的形式表示出来,使项目成功实现成为可能。

     (3)

     项目的主要内容 在软件方面,基于视频数据是由视频﹑音频以及文字等多模式信息流的形式组成,并且这些同步的信息流之间又有语义上的相互关联性,通过开发包括自动场景切割﹑台标定位和语音 DNA 等在内的多模式视频信息处理技术,利用这些数据流之间相互语义关联的特性,提高系统对视频内容分析理解的有效性和可靠性,达到在一定应用范围内智能检索的目的。在实现有效智能检索的基础上,系统可以根据需求对索引出的视频段进行加工处理,包括特写镜头慢速回放﹑水印加密等等。在硬件方面,系统通过分布式多重专用处理器并行计算的方式,实现系统运行的快速有效。

     2. 项目的技术方案

     (1)技术方案的主要内容

     视频智能化检索和处理就是通过对视频流中包含的各种信息进行综合分析,对事件内容给出一个较为全面的描述。因此,对各种信息的分析和获取建立在图像识别和处理,语音识别和处理,文字识别和处理等基础之上。以下是本项目方案所涉及到的主要技术内容。

     ●

     图象识别和处理:

     ·关键人物的人脸识别系统 ·运动物体的追踪系统 ·电影或电视场景切换的自动识别系统 ·慢动作播放 ·图像放大 ·数字水印 ·电视台标识别

     ● 语音识别和处理:

     ·语音关键词识别系统 ·语音 DNA 系统(话者识别)

     ·语音合成

     ● 文字识别:

     ·文字定位 ·文字识别 ·文字内容与视频内容的相关性判断

     ● 知识工程以及人工智能

     ●

     具有自学习和自适应的综合智能化评判系统

     其中,场景的自动分割﹑台标定位﹑语音 DNA 识别﹑特写镜头慢速放大和水印加密又成为技术内容的关键。整套系统的工作和技术原理拓扑图如下所示。

     通过场景自动切割﹑台标定位和语音 DNA 技术的交互作用形成的多模式视频信息处理方式,快速有效地解决了自动标引的问题,使基于内容的智能化检索易于实现。

     特写镜头慢速放大和水印加密技术的引入又丰富了视频处理内容,使系统能够对用户输入的搜索关键字进行智能分析并给出符合搜索要求的视频段。例如,用户给出“中央电视台胡锦涛讲话内容”的检索要求,系统就可以智能的分析用户要求,在视频资料库里找出相应内容片断。

     视频判断视频处理视频识别智能化视频检索与处理系统示意图语音DNA识别视频信息文字识别 人脸及特定物体识别场景切换识别智能判断知识库智能判断反馈自学习/自适应综合智能判断电视台节目制作互联网与电子商务远程教学展览场馆运营管理体育训练与赛事辅助公安司法与反恐监控视频游戏音像资料库管理数字水印处理 视频分离 慢镜头 图像放大 关键帧提取智能检索引擎语音关键词识别人机交互处理视频标引 电视台标处理 实时切割回放

     智能化视频检索与处理系统主要由以下部分组成:

     ●

     用户视频信息采集

     主要功能是采信视音频信号,将横模拟的信号转换成高清晰的数字信号。

      ●

     视频检索处理器系统

     包括属于图象处理的场景切割﹑台标定位服务器和语音﹑文字处理处理器。这些系统分工合作,共同构成多模式视频检索处理器系统

     ●

     综合智能判断系统

     基于智能识别知识库,通过自学习﹑自适应的方式,对视频检索处理器结果进行综合判断选择,并进行必要反馈。

     ●

     视频处理器系统

     基于视频检索和智能选择判断结果,对所得视频流信息按需进行各种加工处理。

     ●

     范围广泛的应用领域

     通过智能检索引擎接口,可实现在电视台节目制作﹑音像馆及数字图书馆多媒体资料管理﹑互联网与电子商务﹑展馆多媒体运营﹑体育训练与赛事辅助﹑公安司法与反恐监控﹑视频游戏及远程教学等领域的广泛应用。

      (2)

     技术关键问题

     场景镜头的自动分割提供特定时段或全时段镜头切换时间点的统计数据,为电视插播﹑基于内容的视频检索和全片内容的浏览提供服务。镜头切换算法是根据连续图像相关性原理构造的,具有算法简洁,实时性好的特点。

     台标信息为有效的区分整合海量电视资料内容提供了有效的手段。根据台标画面固定不变,背景不断变动这一特征,利用统计方法,可在一段时间内将台标从画面上分割出来,从而完成台标定位,为后续工作大下基础。

     语音关键词识别是对视频内容进行定义的一个十分重要的技术,虽然目前的语音识别技术对于连续长句子识别效率不高,但对于经过特殊训练的关键词的识别,从实际应用的效果和技术角度来看,语音关键词识别在视频智能化系统中是一个切实可行的技术。通过对语音关键词库进行分类,可进一步保证识别的快速性和准确性。

     语音DNA识别技术通过特征参数提取(语音分析)和识别算法(或模型)的选取两个关键步骤,在必要的样本模式的训练后,实现未知模式的识别。另外还采用自学习技术,如果在进行识别过程中发现误判,通过自学习分析误判原因,利用聚类分析方法改进语音库,有效的提高识别率。

     特写镜头慢速放大技术的关键是图像放大与帧间插值两个问题。在图象放大问题上,通过自主开发的超线性算法,有效的解决了模糊化和纹理方向改变的问题。在慢速回放问题上,通过研发新型的运动补偿内插算法,在充分利用图像信号的帧间相关性的同时,还充分利用其帧内相关性,将运动估值与图像分割有机地结合起来,既刻画出它们之间地相互依赖性,又采用了恰当的解藕处理,从而改进了图像质量。

      水印加密技术为保护视频信息的版权以及实用的合法性提供了有效的指南,本项目通过采用基于离散余弦变换和小波变换的一组高效的水印嵌入和盲检测方法,在不完全解码的情况下快速实现水印的嵌入和检测,同时实现了鲁棒性好和不可见性的特点。

     (3)先进性和创新性

     基于内容的智能化视频检索处理与传统视频检索处理手段相比,有着显而易见的先进性。

      基于内容的智能化检索和处理 传统检索和处理 检索手段 以语义感念检索 以文件存贮目录检索 工作方式 机器自动完成 需大量借助人力辅助 检索结果 与需求直接匹配视频段 大量包含需求内容的视频文件 效率 简洁高效 费时费力 检索结果应用 能直接进行编辑处理 需要再加工后才能使用 功能性 能够根据需求进行特写镜头慢速放大等实用功能 结果单一,五更多功能延伸 结果安全性 具有水印加密功能,安全性高,防止侵权 ﹑ 盗版等 无安全防范功能

     我们的系统在技术上又具有以下技术创新之处:

     ●综合图像﹑语音和文字的多模式视频信息处理 ●电视台台标的准确识别定位 ●对不同方言和语种的有效识别 ●业界领先的水印加密技术 ●分布式多重并行计算的硬件模式 ●运行独立﹑嵌入灵活的系统结构

     3. 项目的阶段与进度

     时 间 进 度 主 要 实 施 内 容 阶段成果及形式 2004 年 5 月至 2004 年 10 月 进行 UML 文档和数据库设计,优化公司原有技术功能,确定技术方案,配备相关人员。

     文档、技术整理 2004 年 11 月至 2005 年 6 月 前期技术探索,解决辅助技术问题。

     配备该系统运行的硬件环境,硬件系统集成、测试;系统试运行。

     技术手册,软件模块

     硬件环境 2005 年 6 月至 2005 年 11 月 关键技术攻关,多项技术整合。

     系统软件和部分组件的开发与完善、根据客户的需求开发个性化的软件。

     系统完善 2005 年 12 月至 2006 年 4 月

     系统整体的调试、测试,真正系统的解决方案形成,编写统一的用户手册、操作手册。

     用户手册、操作手册

     4. 资金筹措及使用

     项目总投资

     单位:万元

     投资概况 经费 总额 自筹资金 政府资金 其它 资金 合计 自有资金 合计 国家 广东省 市科技局 已投入资金

     1195 1195

      计划新增投资

     723.27 713.27

     10

      10

     其它资金投入情况说明:

     计划新增投资预算

     开支类别 计划新增投资 申请区科技局资助经费 主要用途 (万元)

     申请区科技局资助 总计 723.27

      其中:基本建设费

     设备购置费 167

     能源材料费

     试验外协费 207

      专用业务费 223.27

      人员费 126 10 用于招聘高素质人才 管理费

     其它

     计划新增主要仪器设备 名称

     规格型号 单位 数量 国产/进口 单价(万元)

     合计(万元)

     Multimedia 服务器

     台 2 进口 47

     94

     Attribute Library 媒体库

     个 1 进口 52 52 千兆以太网Switch

     个 2 进口 1.5 3 PC

     台 20 进口 0.9 18 合计

     167

     四﹑经济及社会效益分析

     1. 市场分析

     随着数字化和网络化不断深入人们的社会生活,信息在人们的思想中将会以全新的概念出现,从单一的报刊杂志等文字形式跃升到以数字化多媒体信息模式为主。同样,今后信息行业的发展也将会以多媒体为中心,通过将图像、语音及文字的信息有机整合,产生更直观生动,更容易使用户接受的信息存在形式。在有了大量的视频多媒体信息之后,多媒体数据库的有效管理,按需进行的视频内容检索,就成为急需解决的关键问题。

     本项目所研发的智能化视频检索和处理系统正是基于此种考虑,使基于内容的视频信息检索和处理成为可能,满足在电视媒体应用﹑互联网智能检索﹑音像资料库管理﹑反恐监控系统﹑司法领域﹑展馆多媒体运营系统﹑体育训练和赛事辅助系统﹑远程教学﹑电子商务﹑视频游戏以及有线和无线通信服务等涉及到社会生活各方面内容的领域里深入有效的应用。

     (1)

     电视媒体应用

     电视媒体资产管理是本系统的一大应用领域。以该系统为基础,在未来的媒体传播行业中,电视台可以容易的从传统的传播服务向网络的交互式服务、大众化服务向个性化服务、单一赢利模式向多元赢利模式的转变。我国现在大致有30 个省级台、300 个市级台,本公司的目标市场为全国性的电视台及有实力的地方台。

     从现有国内电视台设备与技术的现状来看,所有的电视台实现完全数字化和智能化视频信息检索处理还需一段时间。因此目前该系统计划的应用主体是国家级的大型电视台。随着电视台在其产品的使用过程中,电视台平均每年还需在此基础出投入相当数量资金来进行功能扩充、性能提高,因此,该产品的寿命期预计在 10-15 年内。

     由于这些国家级的电视台和地市级电视台的应用会引导国内整个广电行业对媒体数字化应用的方向,甚至会建立这方面相关的标准,因此这个市场是非常有潜力,一旦形成,其规模市场将非常巨大,在产品寿命期内随着国内电视台的逐步数字化,整个市场的容量大约为 40 个亿。我公司欲占 1/10,而且在产品寿命期内我们会根据市场需求与最新技术方向,不断地调整、升级,开发新的相关产品来,以确保占领市场、扩大市场份额。

     (2)

     音像资料管理

     音像资料馆的数字化管理是我们智能化视频检索和处理系统的又一重要应用领域。作为一门新兴的事业,其发展历史不过 10 余年,是广播电视事业和信

     息产业相结合发展到一定程度的产物。通过对音像资料的分类整理和有效的保护、合理的开发利用,更好地为社会、为广播电视宣传服务。其主要功能应是信息功能、档案功能和为新闻宣传提供背景材料的资料功能。而这些正是基于内容视频检索处理的长处所在,通过应用我们的系统,能够使音像资料管理的数字化进行的更深入彻底。

     音像资料馆在数字化时代,可以看作是一个广播影视资料的总数据库或计算机工作平台,可通过计算机对所存资料的编辑处理,达到高度智能化的程度,检索使用可以随心所欲,其传输更加迅速、清晰、可靠。美国 CNN 应用这一手段,能把现场拍摄的资料,同步进行切换播出,同时和历史资料数据紧密衔接,快速调回历史资料,在较短的时间内制作出有深厚历史背景的专题电视片供及时播出以感染观众。香港无线电视台 1996 年在播出广州白云机场撞机事故这一新闻后不到 1 小时,就制作播出了大陆 10 年中所有空难事故的专题资料片近 30 分钟,就是完全靠音像资料数字化管理这一先进手段而完成的。

     我国目前有省、市音像资料馆上百家,由于起步晚,受多方面条件的制约,其发展规模和速度,特别是在现代技术的运用上还难以跟国外音像资料相抗衡。但在今后 10 年的数字化进程中,通过运用各种先进的数字多媒体技术,包括本项目研发的智能化视频检索和处理系统在内,可以使我国的音像资料管理行业得到彻底革新,使其适应在数字化时代继续为传媒、大众和社会进行有效服务。

     (3)体育训练与赛事辅助

     当今的体育竞技更讲求应用先进的科学训练理念和高科技的训练比赛系统。例如在足球训练比赛上,借助多媒体方式进行战术训练指导和对手球队的赛前综合分析已经逐渐得到广泛应用。而所有这些,都需要一个有效的视频资料管理和检索系统的支撑。

     2008 年奥运会将在北京举行。北京申办奥运时有三个口号:一是“绿色奥运,环保奥运”,二是“新北京,新奥运”,三是“现代奥运”。针对最后的一个口号,现代化、科技化、数字化实际也是北京奥运商业的争夺焦点。而本项目研发的智能视频检索和处理系统通过嵌入到实时体育比赛数字化素材管理系统中,将会在这次奥运战略及以后的体育界中有纵身的发展空间。

     我国体育事业正在向国际化、多元化发展,国际交流的机会越来越多,体育事业的市场化势必越来越成熟,实时体育比赛数字化素材管理系统能帮助相关的体育行业机构更好地管理、运用其自身资源,创造更高的经济效益。

     基于内容的智能化标引检索过程使得体育比赛的技术统计数据能够和具体的视频片段联系在一起。可以在赛事结束后,把技术统计数据和相关的视频资料提供给运动员、教练等,帮助他们对自己、对手的技术动作和战术等进行分析,以便制订针对性的训练计划,提高比赛成绩。相对于传统的通过录像回放方式进行赛事分析的方式,这种分析方式除了方便快捷之外,最大的优势在于能够结合以往比赛资料进行分析,分析结果更加客观、准确。另外教练和运动员可以在比

     赛开始之前利用电视台体育媒体资产库中的统计数据和视频片段,分析对手的技术特色和可能战术,结合比赛场地和天气预报等信息,制订相应的战术。

     基于 2008 年北京奥运这个庞大的商业机会,相信我们的系统能够在赛场资料获取管理,赛事全球范围的新闻发布,以及中国各支参赛队的训练辅助等领域得到广泛的应用。奥运正式比赛项目有大小数百项,而且届时各国新闻媒体对传媒硬件设施也会有相当大数量的需求,我们的智能化视频检索处理系统将会有大量运用。而且,通过技术转让用以嵌入到其他赛事辅助系统中,也将有很大的市场前景。

     (4)展览场馆多媒体运营

     现代社会中各种功能目的的展览馆、会馆的建设依然热潮不断。就科技馆或者科学中心这个概念而言,国家级及省级的馆场建设也是非常多样。但摆在面前急需解决的问题,是需要有一个智能化的多媒体运营系统来辅助各个场馆的日常运营,达到有效吸引参观者的目的。智能化的视频检索处理系统为这个问题的解决提供了一个有效的方式。

     通过把展馆的内容数字化,以多媒体的形式存放于展馆数据库中。系统就可以方便参观者对展馆内容基于内容的查询,系统也可以个性化的为参观者进行参观节目内容的推荐选择等等。结合互联网的发布,也可以实现展馆参观内容的网络数字化,并以此为平台实现对参观者更方便的网上参观节目的发布介绍,个人资料的注册,过往参观记录的管理,新的参观计划的节目预定和规划,相关展览数字化内容的网上销售,甚至虚拟参观等等。

     国内现阶段大小展馆多种多样,而我们的系统又具有相对独立和易嵌入的特点,在这个市场范围内,结合相应的市场公关和产品概念介绍,在未来 10 到 20年的都有着广泛的应用前景。

     (5)其他更多应用领域

     基于内容的视频检索和处理系统是多媒体数字化管理的核心,是数字时代信息共享的必要手段。在现阶段国内的市场前景下,除了以上具体阐述的应用领域,还会在互联网智能检索﹑反恐监控系统﹑司法领域﹑远程教学﹑电子商务﹑视频游戏以及有线和无线通信服务等领域得到广泛应用。

     并且,数字化社会的实现是一个不断前进的过程。伴随着多媒体信息形式深入到人们生活的各个方面,更多更丰富的应用领域也将不断产生。而作为为所有多媒体视频信息服务的智能化检索处理系统,必将以独立或者嵌入的形式服务到这些应用当中。并且随着数字化应用范围的不断延伸,智能视频检索处理的应用也将不断延伸。我们的产品在这个过程中将以用户为中心,不断丰富完善,变得功能更强大、更智能。

      2. 经济及社会效益分析

     (1) 本项目主要经济评价指标

     本项目估算期 6 年,其中建设期 1 年,试产期 1 年,生产期 4 年。

     本项目主要经济评价指标详见下表:

      序号 项目 单位 金额 备注

     销售收入 万元 7800 达产后正常年度

     利润总额 万元 3715.97 达产后正常年度

     所得税 万元 1226.67 达产后正常年度

     税后利润总额 万元 2489.70 达产后正常年度

     销售税金及附加 万元 792.84 达产后正常年度

     其中:增值税 万元 727.37 达产后正常年度

     城市建设维护税 万元 50.92 达产后正常年度

     教育费附加 万元 14.55 达产后正常年度

     财务内部收益率(税后)

     % 124.79% 全部投资

     静态投资回收期(税后)

     年 2.44 全部投资

     财务净现值(税后)

     万元 77 全部投资

     投资利润率 % 144.79% 全部投资

     投资利税率 % 177.98% 全部投资

     资本利润率 % 144.79% 达产后正常年度

     销售收入利润率 % 47.64% 达产后正常年度

     资产负债率 % 3.94% 达产后正常年度

     流动比率 % 2433% 达产后正常年度

     速动比率 % 2085% 达产后正常年度

     盈亏平衡点(BEP) % 25.13% 达产后正常年度

     盈亏平衡点销售收入 万元 1960.14 达产后正常年度

     (2) 产品成本

     本项目对原材料、燃料及动力、工资及职工福利费、折旧费、修理费和其他费用分项进行测算,达产年度的总成本为 3291.20 万元,经营成本为 3176 万元。其具体情况详见附表《总成本费用估算表》。

     ●原材料、燃料及动力

     本项目对产品生产所需原材料及主要材料,燃料及动力价格均以近几年市场已实现的价格为基础,并考虑了一定的物价上涨因素,原材料和电的价格中含增值税。

     每套智能化视频检索与处理系统原材料为 99 万元。

     本项目达产年度的动力费用为 12 万元。

     ● 工资及职工福利费

     根据本公司现有工资水平及本项目实际情况,预计年工资及福利费为 171万元。(其中福利费按工资总额的 14%计取)。

     ● 折旧费和摊销费

     固定资产原值为 167 万元,按平均年限法计算计算折旧,折旧年限 5 年,固定资产残值率取 4%,折旧率为 9.6%,年折旧额为 32.40 万元。余值在估算期末收回。

     本项目各年固定资产折旧的具体情况,详见附表《固定资产折旧估算表》 本项目长期待摊费用为 333 万元,按 5 年摊销,年摊销费为 66.6 万元。详见附表《无形资产及长期待摊费用摊销估算表》。

     ● 修理费

     本项目固定资产投入使用后,修理费按年折旧额的 50%计取,每年 16.20万元。

     ● 其他费用

     其他费用是在制造费用、销售费用、管理费用中扣除除工资及福利费、折旧费、摊销费、修理费后的费用。为简化计算,该费用按工资及福利费的 100,每年约为 171 万元。

     (3) 销售收入

     本项目实施后,每套智能化视频检索与处理系统单价为 325 万元,达产后年销售收入为 7800 万元。

     (4) 销售税金及附加

      年销售税金及附加按国家规定计取,产品缴纳增值税。销项增值税税率为17%,增值税用销项增值税额减去总成本费用估算表中的进项增值税额。城乡维护建设税为增值税的 7%,教育费附加为增值税的 3%。

     产品销售收入和销售税金及附加估算列在附表《销售收入和销售税金及附加估算表》

     (5)利润

     本项目达产年度的利润总额为 3715.97 万元,税后利润为 2489.70 万元。

     本项目盈余公积金按税后利润的 10%计算,公益金按税后利润的 5%计算。达产年度的盈余公积金和公益金分别为 248.97 万元和 124.48 万元。

     本项目各年度损益情况,详见附表《损益表》

     (6) 各年度资金来源与运用情况,详见附表《资金来源与运用表》。

     从《资金来源与运用表》可以看出,本项目计算期内各年度的资金收支,可以做到财务平衡且有盈余,计算期内累计盈余资金为 6359.39 万元。

     (7) 现金流量分析

     本项目所得税后财务内部收益率为 124.79%所得税前财务内部收益率为166.4%。均大于基准财务内部收益率(25%),说明该项目盈利能力达到并超过了行业基准要求。所得税后的静态投资回收期为 2.44 年(含建设期)。低于行业的基准投资回收期(10.3 年)。所得税后财务净现值和所得税前财务净现值均大于0。

     全部投资财务现金流量情况,详见附表《现金流量表(全部投资)》。

     自有资金财务现金流量情况,详见附表《现金流量表(自有资金)》。

     (8) 盈亏平衡分析

     本项目以生产能力利用率表示达产年的盈亏平衡点(BEP)为 25.13%,盈亏平衡点的销售收入为 1960.14 万元。

      (9) 社会效益分析

     本项目每年将向国家提供销售税金及附加 792.84 万元,所得税 1226.27 万元。社会效益和经济效益都很好。

     (10) 经济评价结论

     本项目不仅满足了本公司自身发展的需要,优化其产品结构,降低其经营风险,增强其市场竞争能力,而且,该项目所得税后财务内部收益率为 124.79%,所得税前财务内部收益率为 166.37%。均大于行业基准财务内部收益率,所得税后的静态投资回收期为 2.44 年(含建设期)。低于行业的基准投资回收期(9 年)。投资回收期较短。

     从以上经济分析来看,本项目投资合理,智能化视频检索与处理系统具有广阔的发展前景,投资回收期短,财务内部收益率高,具有良好的经济和社会效益。因此,本项目从经济上考虑可行。

      附表:

     1、固定资产投资估算表 2、流动资金估算表 3、投资使用计划与资金筹措表 4、销售收入和销售税金及附加估算表 5、总成本费用估算表 6、固定资产折旧估算表 7、无形及递延资产摊销估算表 8、损益表 9、现金流量表(全部投资)

     10、现金流量表(自有资金)

     11、资金来源与运用表 12、资产负债表 13、财务敏感性分析表 14、经济分析结果汇总表

     五﹑风险分析

     目前,广电业正步入数字化、网络化的新阶段,该行业具有基础作用及广阔的前景,是国家要大力扶持的一个产业。在此背景下,《智能化视频检索与处理系统》的发展将具有一个比较宽松的环境。它所面临的风险主要体现在如下几方面:

     1 1 . 技术、人员风险

      (1)相关技术标准还不健全,存在不确定性; (2)技术的发展对产品领先性的压力; (3)关键技术人员的不稳定引起的核心技术的流失。

     针对上述技术风险因素,公司分别采取如下措施:

     及时追踪和把握国内外行业最新发展动态;严格按照 ISO9001 设计程序文件,对技术方案进行全面、科学的论证;与国外专家合作,及时把握技术前沿动向,保持技术领先;采用先进的生产和检测设备,从而降低实施本项目的技术风险。

     针对人员风险因素,公司建立引进人才和激励人才发展的机制,以确保稳定、壮大研发队伍的同时,对关键人员给予股票期权,并为优秀员工提供定期在美国公司进行交流轮训的机会;在公司技术产权管理上,严格按国际标准执行,保障公司技术的连续性,将技术及人员的流失降至最低。

     2 2 . 资金风险

     由于公司目前正处于发展期,该项目在开发过程与产品化过程中需要一定的资金支持。对于资金上的风险,我们通过两个渠道进行避免。其一,有公司注册资本为 2142 万元;其二,由于公司行业发展前景可观,预期回报率较高,因此,经得广州市市长办公会议的批准,已于 2003 年得到广州科技风险投资有限公司1000 万元的投资(增资合同见附件)。另外,公司的两个主要产品:“媒体内容管理”及“网络安全咨询服务”的市场开拓工作已全面展开,并已建立了客户,如“上海电视台”、“陕西电视台”、“上海联通”等,而我们也根据产品特性设定

     了高质量的目标客户,如:“中国工商银行”、“中国人民银行”、“中国移动”等,从 2003 年开始陆续有销售收入来支持该项目的产业化建设。

     附表 1:固定资产投资估算表

      单位:万元 序号 工程或费用名称

     土建工程

     设备购置费

     安装工程

     其他费用

     合计

     其中外汇

     1 固定资产投资

     0.00 167.00 0.00 333.00 500.00

     1.1 第一部分

     工程费用

     0.00 167.00 0.00 0.00 167 .00 0.00 1.1.1 土建工程及装修

      0.00 0.00

     0.00 0.00 1.1.2 生产、测试设备

      167.00

      167.00

     1.1.3 生产线

     0.00

     1.1.4 模具费

     0.00

      小计

     0.00 167.00 0.00 0.00 167.00

     1.2 第二部分

     其他费用

      技术开发费

      93.00 93.00

     1.2.10 开办费

      240.00 240.00

      小计

     0.00 0.00 0.00 333.00 333.00

      第一第二部分费用合计

     0.00 167.00 0.00 333.00 500.00 0.00 1.3 预备费用

     0.00

     1.3.1 基本预备费

     0.00

     1.3.2 涨价预备费

     0.00

     2 固定资产投资方向调节税

     0.00

     3 建设期利息

      0.00 0.00

      合计 (1+2+3)

     0.00 167. 00 0.00 333.00 500.00 0.00

     附表 2:流动资金估算表

     单位:万元 序号

     项目

     周转天数

     周转次数

     1 1 2 2 3 3 4 4 5 5 1 1 流动资产

      257.27 542.93 971.43 971.43 1.1 应收帐款

     30 12

     72.58 149.42 264.67 264...

    • 范文大全
    • 职场知识
    • 精美散文
    • 名著
    • 讲坛
    • 诗歌
    • 礼仪知识