首页 范文大全 古典文学 职场知识 中国文学 公文书信 外国名著 寓言童话 百家讲坛 散文/诗歌 美文欣赏 礼仪知识 民俗风情
  • 工作总结
  • 工作计划
  • 心得体会
  • 竞聘演讲
  • 会议发言
  • 爱国演讲
  • 就职演说
  • 开业开幕
  • 思想学习
  • 征文演讲
  • 经验材料
  • 述职报告
  • 调研报告
  • 工作汇报
  • 年终总结
  • 申报材料
  • 学习体会
  • 企划方案
  • 活动方案
  • 技巧经验
  • 模板范例
  • 思想宣传
  • 经济工作
  • 工作报告
  • 组织人事
  • 反腐倡廉
  • 慰问贺电
  • 先进事迹
  • 思想汇报
  • 入党申请书
  • 党会发言
  • 先进性教育
  • 入团申请书
  • 个人简历
  • 演讲稿
  • 调查报告
  • 实习报告
  • 和谐社会
  • 观后感
  • 读后感
  • 作文范文
  • 自我鉴定
  • 讲话稿
  • 自查报告
  • 数据抓取反不正当竞争法律规制

    时间:2020-10-22 15:05:02 来源:蒲公英阅读网 本文已影响 蒲公英阅读网手机站

    相关热词搜索:抓取 规制 反不正当

     数据抓取的反不正当竞争法律规制

     内容提要 在现代社会不断网络化的进程中,海量数据通过网络被上传、承载和运输,人们称之为大数据时代的来临。大数据是以应用价值高、类型多、速度快和容量大等为主要特征的数据集合,经过使用对海量数据进行处理的技术,从而生成具有价值的数据。大数据是无法用常规软件在一定时间内获取、收集的一个集合内的众多数据,需要通过合适的工具辅助,对广泛异构的数据源进行存储和分析,从而将数据结果呈现给终端用户。大数据不仅是数据概念上的众多,更是对众多数据多次反复运算而得的结果。大数据时代的发展正在将更多公民囊括其中,每个人在日常生活中不可避免地运用到数据抓取的技术以获得所需的内容。

     由此发展的各类数据处理工具也会将用户的个人信息不断整合,根据用户的数据使用痕迹抓取更多相关信息。但在带来个性化体验的同时,也会泄露用户的个人隐私信息。诚然为了用户使用的便捷性,应当让渡一部分的个人权利,但是究竟需要让步到何等地步,数据抓取的边界到底在哪里,这些问题都需要通过相关的法律加以限制。此外,数据抓取不仅会侵害个人利益,对企业等主体也会造成侵害,需要相应规制以减少这些侵害,从而规范市场竞争行为。

     通过对数据抓取技术可能造成的侵害进行研究,对侵害行为进行法律技术上的规制,在享受数据抓取技术发展红利的同时,尽量规避过度抓取信息等问题造成的恶劣影响。通过借鉴国外类似规制,实现完善反不正当竞争法,协调数据抓取与反不正当竞争法规定之间矛盾的目的。

     [关键词]大数据,数据抓取,个人信息,反不正当竞争法

     ABSTRACT

     In the process of continuous networking in modern society, massive data is being uploaded, carried and transported through the network, which is called the coming era of big data. Big data is a data set characterized by high application value, many types, fast speed and large capacity. After processing massive data, it generates valuable data. Large data is a large number of data that can’t be acquired and collected in a certain period of time by conventional software. It is necessary to store and analyze widely heterogeneous data sources with appropriate tools, so as to present the data results to end users. Big data is not only the concept of many data, but also the result of repeated calculation of many data. The development of the big data era is encompassing more citizens. Everyone inevitably applies data capture technology in daily life to get the content they need. All kinds of data processing tools will integrate the user"s personal information constantly, grab more relevant information according to the user"s data trace, bring personalized experience, but also leak the user"s personal privacy information. It is true that for the convenience of users, some of the privacy rights should be transferred, but how far does the privacy rights need to be conceded and where is the boundary of data capture? These problems need to be restricted by relevant laws. Data capture will not only infringe on personal interests, but also on enterprises and other subjects. It is necessary to regulate these infringements in order to regulate market competition. Through the research on the possible infringement caused by data capture technology, the legal and technical regulation of infringement is carried out. While enjoying the development dividend of data capture technology, we try to avoid the bad influence caused by over-grabbing information and other problems. By drawing lessons from similar regulations abroad, we can improve the Anti-unfair Competition Law and coordinate the contradiction between data capture and anti-unfair competition law. Keywords Big Data, data capture technology, personal information,Anti-Unfair Competition Law

     目录

     一、数据抓取行为概述与现状 ...................................... 1

     (一)数据抓取概述与风险 .................................... 1

     1.抓取行为违反网站意愿 .................................... 2

     2.数据抓取干扰网站正常运营 ................................ 3

     3.技术抓取了法律保护的数据和信息 .......................... 3

     (二)数据抓取技术被滥用的现状 .............................. 4

     (三)合理的数据抓取行为 .................................... 5

     二、不当数据抓取行为的几种类型 .................................. 6

     (一)技术开发者抓取数据未获用户授权 ........................ 6

     (二)开发者对数据利用不符合规定 ............................ 7

     (三)经营同质内容的平台抓取原用户信息未获得开发者授权 ...... 8

     三、对数据抓取的现有规制 ........................................ 9

     (一)国外对数据抓取行为的规制 .............................. 9

     1.各国关于个人信息保护的立法规制 .......................... 9

     2.规制在几个案例中的体现 ................................. 10

     (二)我国反不正当竞争法对不当数据抓取的规制 ............... 12

     1.新浪微博诉脉脉 ......................................... 12

     2.大众点评诉百度地图 ..................................... 13

     3.酷米客诉车来了 ......................................... 13

     4.淘宝诉美景公司 ......................................... 14

     四、对不当数据抓取行为的规制建议 ............................... 15

     (一)借鉴他国内容改善不当数据抓取行为 ..................... 15

     1.完善立法等保障制度 ..................................... 15

     2.建立行业自律制度 ....................................... 16

     (二)提出改进数据抓取不当的措施 ........................... 17

     1.监管者需要做出的改变 ................................... 17

     2.运营商等数据收集方可以改进的问题 ....................... 17

     3.针对个人的改善方式 ..................................... 18

     五、结语 ....................................................... 18

     六、后记 ....................................................... 18

      1 数据抓取的反不正当竞争法律规制

     我们称现在这个时代为大数据时代,在这一时期,大量数据被上传,经过运算得到结果呈现给用户,普通生活中已经无法离开大数据。在使用的同时,人们的个人信息等数据也在被不断上载,在获得信息的同时也在被抓取数据。数据收集方在获得用户数据后,根据用户的使用痕迹对用户信息不断整合分析,为用户提供便利。

     此外,数据抓取也会获取企业等主体的重要信息,也需要相应规制加以保护。所以说用户个人权利让渡的边界问题,何种行为可以得到豁免,对企业等主体的立法保护,这些都需要进一步讨论。

     本文旨在通过研究数据抓取技术目前可能造成的问题,判断不当数据抓取行为,借鉴国外规制这些不当行为的措施,分析我国在反不正当竞争法中对数据抓取行为不当的规制,来讨论如何解决我国存在的数据抓取技术方面的问题。

     一、数据抓取行为概述与现状

     (一)数据抓取概述与风险 数据抓取是通过多种技术手段来获取数据,并根据初设条件对数据进行筛选,获得符合条件的数据并呈现给使用者的数据获取方式,以网络爬虫为代表的数据抓取技术为例,就是通过历遍符合查找条件的网页,利用计算技术快速筛选,选择符合用户需要的内容,之后下载到本地形成互联网内容镜像备份1 ,实现数据抓取的目的。数据抓取技术在目前获得了广泛应用,通过爬虫可以更新搜索引擎所获数据;在 web 上抓取技术还可以确认 html 代码、勘察链接等;还能根据预设条件来抓取信息,例如通过电子邮箱地址排除垃圾邮件。数据抓取技术的应用是计算机网络技术中非常重要的一环,获取数据是对后续数据处理的基础操作,可想而知,需要获得用户使用习惯、信息归集的时候的应用程

     1 李慧敏,孙佳亮:《论爬虫抓取数据行为的法律边界》,载《电子知识产权》2018 年第 12 期,第 59页。

      2 序都必须要使用数据抓取才能进行下一步的内容拓展。

     可以将数据抓取带来的风险分成三种危害结果:

     1.抓取行为违反网站意愿 在数据抓取过程中需要对网站进行扫描,但是有些网站是不允许数据抓取技术采集本网站信息的,如根据淘宝平台法律声明2 ,“除非淘宝网另行声明,淘宝平台内的所有产品、技术、软件、程序、数据及其他信息(包括文字、图标、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有权利均归淘宝或其关联公司所有。未经淘宝许可,任何人不得擅自使用(包括但不限于通过任何机器人、蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载淘宝平台内的任何内容)。”当采集的站点明确禁止爬虫等程序采集或者转载商业化,此时再违背其意志进行采集就可能会造成法律风险。

     网站在声明 robots 协议3 之后,也会规范爬虫这种数据抓取技术可以采集的数据范围。中国互联网协会《互联网搜索引擎服务自律公约》第七条规定“遵循国际通行的行业惯例与商业规则,遵守机器人协议(robots 协议)”,第八条规定“互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由”。即便《互联网搜索引擎服务自律公约》仅适用于中国互联网协会会员单位和自愿加入《中国互联网行业自律公约》的互联网从业单位,但在司法实践中,例如百度诉奇虎不正当竞争案件4 ,北京市第一中级人民法院就把为行业内所公认的 robots 协议认定为互联网行业搜索领域内公认的商业道德。因此数据抓取应当遵从网站robots 协议,如果技术的使用者无视网站设置的 robots 协议,不仅是违背商业道德,还可能会违背相关法律,构成违反诚实信用原则和商业道德的不正当

     2 详见淘宝规则:https://zhongyiyuan.alitrip.com/detail-6114.htm?tag=self,最后一次访问 2019 年 5 月31 日 3 Robots 协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过 Robots 协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

     4 参见:北京奇虎科技有限公司与百度在线网络技术(北京)有限公司等不正当竞争纠纷((2015)西民(知)初字第 13881 号)。

      3 竞争行为。

     2.数据抓取干扰网站正常运营 依旧以爬虫技术为例,具有侵略性的爬虫技术,例如多线程爬虫,可能造成网站负荷过大,由于网络爬虫的特性,在程序开始后会尽可能多的访问页面以实现数据搜集,故而爬虫的使用会占用被访问网站的网络带宽并增加网络服务器的处理开销,甚至导致后台瘫痪,对网站运营造成技术负担5 。此外,网络爬虫可能导致网站所有人丧失对自己网站数据的控制权,如果网站的防火墙等数据防盗措施不力,可能由于爬虫技术抓取数据,导致大量重要信息泄漏,对正常运营的网络公司造成经济损失。这些不规范的数据抓取,都在增加正常网站运营者的压力,不仅仅是给爬虫技术造成不良影响,甚至给技术使用者造成法律风险。

     3.技术抓取了法律保护的数据和信息 技术的使用者在抓取数据的过程中,如果有意避开或者强行突破网站的防盗措施,并且获取了网站不对外公开的数据资料,那么可能会侵犯网站的商业秘密。在社交软件例如微信等程序中,用户会上载个人资料,有些资料属于不对外公开的内容,如果有数据抓取获得了这些不对外公开的个人资料,甚至进行披露、牟利等行为,可能会对用户的个人隐私权造成侵害。

     在《民法总则》中第 111 条规定个人信息收到法律保护,获取个人信息的主体必须依法获取并且保护所获信息,不能非法处置个人信息,《网络安全法》第 44 条规定任何主题都不能非法获取个人信息,或者非法处置个人信息。所以爬虫等数据抓取技术不能随意获取用户信息,否则会受到法律追究。对用户个人信息的来源可以分为两种,随意抓取行为造成的后果也是不同的。用户自行公开的个人信息是否可以认定为同意抓取还尚无定论,而对于用户不愿公开发布的信息,抓取行为有极大可能违法。

     此外涉及个人信息抓取的行为,不止抓取行为本身可能违法,后续造成的

     5 刘清:《网络爬虫针对“反爬”网站的爬取策略分析》,载《信息与电脑》2019 年第 3 期,第 23页。

      4 后果也有可能侵犯法益。例如新浪微博诉脉脉不正当竞争案6 中,在用户使用微博账户登录脉脉并上传通讯录等个人信息后,大量非脉脉用户的个人信息出现在脉脉上,而在微博与脉脉签订的开放 API7 协议中,并没有允许脉脉抓取这些用户的信息,甚至在微博停止脉脉的接口权限后脉脉依旧抓取这些用户的数据,法院最终认定被告脉脉未经许可抓取、使用原告新浪微博数据的行为,违反了诚实信用原则及公认道德,损害了原告的竞争优势,进而构成不正当竞争。

     总之数据抓取技术可能带来的风险比较多,抓取信息过程中,如果爬取数据没有获得用户授权,就存在侵犯隐私权、个人信息权等人格权的可能。如果获取到的内容涉及著作权争议,又可能会对著作权造成侵害。在企业利用不正当数据抓取技术获取竞争对手重要商业数据或者商业秘密时,可能因实质替代获取不正当竞争优势、干扰或破坏他人网络服务的正常运行,违背反不正当竞争法。更严重的是,数据抓取技术使用者还可能因非法获取公民个人信息、非法侵入计算机信息系统、非法获取计算机信息系统数据等涉嫌犯罪,招致刑罚。

     (二)数据抓取技术被滥用的现状 网络程序开发者的各种创意进入市场,促进数据抓取的应用场景和商业模式不断拓展,以今日头条、新浪新闻这些信息获取类的应用为例,基本上是通过积累用户的下载偏好然后进行数据的分析和抓取,从而实现每日的推送。此外,在传统的互联网搜索、天气预报信息聚合、视频图片搜素信息应用当中,都有数据抓取技术的广泛应用8 ,在对大量信息的整合之后,根据用户需求或者推断用户需求进行内容的前台呈现。

     数据抓取不当还会造成过度获取手机用户信息的问题。比如在 2018 年 12

     6 参见:北京淘友天下技术有限公司、北京淘友天下科技发展有限公司与北京微梦创科网络技术有限公司不正当竞争纠纷上诉案((2016)京 73 民终 588 号)。

     7 API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

     8 李慧敏,孙佳亮:《论爬虫抓取数据行为的法律边界》,载《电子知识产权》2018 年第 12 期,第 59-60 页。

      5 月 QQ 音乐、网易新闻等 App 就因为未经用户同意而手机用户个人信息而被中国互联网协会点名9 ,过度数据抓取以获得自己的竞争优势,在构成不正当竞争的同时。对用户的权益也造成了侵害。

     技术的发展常常会引发使用边界的法律争议,以淘宝为例,在淘宝中的搜索记录常常作为百度等搜索引擎中的指向,这些应用会根据用户的使用记录来进一步推送有关内容,尽管在相关信息的获取上带来了便捷,无形之中也在监控着纳入适用范围的用户。具有相关技术的人完全可以通过用户的使用对数据进行整合分析,从而可以描述出使用者的生活轨迹,实现对公民的立体化监控,这无疑是对个人隐私的严重侵犯10 。尽管通过对数据抓取技术的了解和研究,能够扩大用户的信息来源,增强数据的可信性,同类信息的过度获取也会使用户被自己的兴趣所吸引而受限于自己原有的知识内容,海量的信息令用户受困于更自我的思想空间而陷入信息茧房11 的困境。

     (三)合理的数据抓取行为 数据抓取技术的应用尽管存在边界问题,但还是要本着比例原则合理地利用。这里我们可以学习的就是欧盟的合理利益豁免和确立技术中立原则。

     合理利益豁免可以缓和个人同意与平台使用之间的矛盾,在原有的用户同意机制以用户的个人意见为中心,但在大数据背景下,很多用户甚至并未完全了解隐私协议的内容就做出选择,在这种情况下,用户同意机制可以说并未产生理想效果,我国相关部门监管实践以及 2017 年 12 月颁布的《信息安全技术个人信息安全规范》12 通过提高获得同意的标准、细化征得同意的操作规定希望提高用户同意的真实性,但这些措施并未根本解决问题,关键问题在于受海量数据的冲击,用户无法提取协议中的有效信息,并且许多功能在用户不授权的

     9 详见搜狐科技:http://m.sohu.com/a/285799210_404517,最后一次访问 2019 年 5 月 31 日。

     10 郑志峰:《人工智能时代的隐私保护》,载《法律科学》2019 年第 2 期,第 52 页。

     11 信息茧房是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象。

     12 详见百度百科:https://baike.baidu.com/item/信息安全技术个人信息安全规范/22552042?fr=aladdin,最后一次访问 2019 年 5 月 31 日。

      6 情况下根本不能使用,用户为了正常使用必须授权,以此为前提,用户同意也不能认为是自由的。所以对数据抓取的适当合理利益豁免是非常有必要的,为了保障用户的使用权,应当适当让渡用户的同意权。

     技术中立原则是指技术提供的中立,数据抓取技术就是需要秉持中立原则的技术,我国在司法实践中确立了技术中立原则:对技术的提供者使用法律责任豁免,对于实际适用的主体则应视具体行为而定责。同时技术提供者具有合理注意义务,在提供数据抓取技术后,如果检测到使用者的侵权行为,应当及时处理或者上报。13

     二、不当数据抓取行为的几种类型

     (一)技术开发者抓取数据未获用户授权 用户在使用开发者提供的服务时,双方同意以用户提供的信息以及在某些情况下的付费为对价来获得软件服务,所以用户同意是抓取数据的必要条件,没有用户的授权而开发者获取数据属于非法行为,不符合我国法律关于获取公民电子信息需要许可的规定,例如我国《消费者权益保护法》第 29 条规定了经营者对待消费者个人信息应合法、正当、必要,明示收集、使用信息的目的、方式和范围,获得消费者同意。《全国人民代表大会常务委员会关于加强网络信息保护的决定》(2012 年 12 月 28 日第十一届全国人民代表大会常务委员会第三十次会议通过)第 2 条14

     “网络服务提供者和其他企业事业单位……并经被收集者同意,不得违反法律、法规的规定和双方的约定收集、使用信息。”,以及《电信和互联网用户个人信息保护规定》第 9 条15 “未经用户同意,电信业务

     13 李慧敏,孙佳亮:《论爬虫抓取数据行为的法律边界》,载《电子知识产权》2018 年第 1 期,第 63-64 页。

     14 详见中国人大网:http://www.npc.gov.cn/huiyi/cwh/1130/2012-12/29/content_1749752.htm,最后一次访问 2019 年 5 月 31 日。

     15 详见法律图书馆:http://www.law-lib.com/law/law_view.asp?id=425699,最后一次访问 2019 年 5 月31 日。

      7 经营者、互联网信息服务提供者不得收集、使用用户个人信息。电信业务经营者、互联网信息服务提供者不得收集其提供服务所必需以外的用户个人信息或者将信息用于提供服务之外的目的,不得以欺骗、误导或者强迫等方式或者违反法律、行政法规以及双方的约定收集、使用信息”等规定。

     也有数据收集方利用合理数据抓取豁免的优势,利用个人对许可内容不了解而过度获取用户许可权限,这也应属没有获得用户授权的范畴。例如 2019 年3 月,上海消保委就对网购平台、旅游出行、生活服务等 39 款手机 app 开展涉及个人信息权限测评16 ,发现饿了么、聚美等 9 款软件涉嫌过度获取权限,许多权限获取与否对软件的正常使用并无影响,但平台仍把这些权限许可添加在用户同意须知中,以这种方式获取用户联系人、短信、录音、“监控外拨电话,重新设置外拨电话的路径”等权限,极大侵犯了用户的隐私权、个人信息权等人格权。

     另一方面,用户的数据属于个人信息,公民对此享有个人信息权、隐私权等权利,对数据抓取平台收集信息的许可就是在让渡自己的权利来获取部分利益,那么没有许可而试图收集用户信息的行为,自然是不合法的。

     (二)开发者对数据利用不符合规定 根据我国《消费者权益保护法》第 29 条,还有《关于加强网络信息保护的决定》第 2 条明确规范了“网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息,应当遵循合法、正当、必要的原则”,在《电信和互联网用户个人信息保护规定》的第 9 条也有“电信业务经营者、互联网信息服务提供者收集、使用用户个人信息的,应当明确告知用户收集、使用信息的目的、方式和范围,查询、更正信息的渠道以及拒绝提供信息的后果等事项”的规定17 。

     这些现有的法律规制确立了开发者获取用户数据必须经过授权的原则,也

     16 详见中国新闻网:http://www.chinanews.com/cj/2019/03-29/8794708.shtml,最后一次访问 2019 年 5月 31 日。

     17 王雪原:《用户数据抓取不正当竞争行为的法律规制研究》,硕士学位论文,华东政法大学,2018年 4 月,第 25 页。

      8 就是用户同意机制,开发者获取用户信息需要适当适度,在获取信息后还要妥善保护,防止信息泄露。以新浪微博诉脉脉不正当竞争一案为例,除了脉脉非法抓取新浪微博的用户数据,构成不正当竞争之外,法院进一步指出,新浪微博在发现脉脉非法抓取微博用户信息的情况下,以他人利益作为交换条件,放纵不正当竞争行为,认定新浪微博在保护用户信息方面也存在不足。所以这一案件还反映了上述法律的规定,即网络服务提供商应当在法律允许的范围内合理使用用户信息,不得以损害用户利益的方式利用或向他人非法转让,以及协助、放任他人非法获取、利用用户的个人信息。

     (三)经营同质内容的平台抓取原用户信息未获得开发者授权

     通过新浪微博诉脉脉、大众点评诉百度18 等同质案件,法院确立了平台之间开放应用程序编程接口(API)获取数据必须经过“用户授权-网站授权-用户授权”的规则,借此来确立市场道德希望能够规范可能违规操作的网站。

     这种 UGC19 模式是通过用户原创内容,以提倡个性化为主要特点,像如大众点评网,就是在不断的吸收用户的评价,从而不断完善网站相应的评分内容,通过大量的内容积累才能实现网站的盈利,因此,如果同质网站抓取 UGC 模式网站上用户发布的信息并在自己网站上发表或使用,相当于无视用户与原网站之间的授权协议,非法抓取了其他网站的智力成果,这种不经开放 API 而擅自获取对方用以盈利的信息用于自用,由于符合实质代替行为,极有可能构成不正当竞争。

     例如大众点评诉百度公司不正当竞争一案,百度未经大众点评许可而抓取平台上的点评信息,既没有原开发者的授权,也没有用户的同意,百度则试图通过简单数据抓取以获取大众点评最终呈现的结果,在点击百度的相关网站后就可以获取大众点评上所提供的信息,百度通过获取大众点评上用户信息的行

     18 参见:上海汉涛信息咨询有限公司诉北京百度网讯科技有限公司等不正当竞争纠纷案((2015)浦民三(知)初字 528 号)。

     19 UGC(User Generated Content,用户生成内容),是伴随着以提倡个性化为主要特点的 Web2.0 概念而兴起的,也可叫做 UCC。它并不是某一种具体的业务,而是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。

      9 为,代替了大众点评对自己用户信息的控制,确实对大众点评的相关内容造成实质代替,这种行为无疑是在不正当竞争,通过取巧的前期数据获取行为造成了对大众点评盈利模式的冲击,没有大众点评对数据抓取的允许,也剽窃了用户上传的内容,违背了我国《反不正当竞争法》第 12 条“经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”。

      三、对数据抓取的现有规制

     (一)国外对数据抓取行为的规制 数据抓取技术在国外发展时间比我国要长许多,许多国家通过法律法规以及行政规章制度对数据抓取技术进行保护、发展和限制,主要表现为对数据抓取技术可能侵害的法益的保护。

     根据上文分析,数据抓取技术可能侵害用户的个人信息权和隐私权,但涉及对具有著作权的内容抓取也会侵犯著作权,如果是对企业的重要商业数据和商业秘密进行获取,还会对企业的经营造成打击,进而可能构成不正当竞争。所以涉及到数据抓取的法律,不应是单纯的某部法律,而是系统的规制体系。

     1.各国关于个人信息保护的立法规制 欧盟制定的 2018 年《一般数据保护条例》(GDPR)20 生效,其中第二章原则中第 5 条第 1 款,要求数据的处理必须合法、公正、透明并且要符合必要限度。第三章数据主体权利中第二节第 13 条和第 14 条规定对于在识别分析等数据处理过程中,数据控制者在透露必要信息之外还应注意提供使用该种方式处理信息的重要性以及处理后果。21 这一条例通过综合方式保护个人信息和隐私,欧盟所确立的数据保护框架正是以 GDPR 为核心的。

      20 详见百度百科:https://baike.baidu.com/item/通用数据保护条例/22616576?fromtitle=一般数据保护条例&fromid=22625075&fr=aladdin,最后一次访问 2019 年 5 月 31 日。

     21 郑志峰:《人工智能时代的隐私保护》,载《法律科学(西北政法大学学报)》2019 年第 2 期,第54-55 页。

      10 美国 1986 年颁布《电子通讯隐私法》(ECPA)22 主要保护公民个人信息权和隐私权,除了禁止政府部门未经授权的窃听,而且禁止所有个人和企业对通讯内容的窃听,同时还禁止对存贮于电脑系统中的通讯信息未经授权的访问及对传输中的信息未经授权的拦截。除了立法方式,美国采用自律政策作为补充,以及时保护公民因数据抓取而受损的权益。23

     日本政府于 2003 年颁布《个人信息保护法》24 ,并在 2015 年颁布了修正案,根据这部法律的基本理念,相继制定并颁布了针对行政机关、独立行政法人等持有个人信息机关一系列法律,在第三方披露、国际转让以及收集和适用敏感个人信息等方面的规定,实现了规范行业对个人信息利用的目的,达到信息保护和信息流通平衡的效果。25

     2.规制在几个案例中的体现 美国 1986 年通过的《计算机欺诈与滥用法》(CFAA)26 中,常常引用的是以下几条,第 2 条规定“未经授权故意访问计算机或者超越授权访问,……从任何受保护的计算机获取信息”,第 5 条“故意传输程序、信息、代码或命令,并未经授权给受保护的计算机造成损坏”。

     典型的案例有,hiQ Labs 与 LinkedIn27 (以下简称为 h 和 L 公司)的数据纠纷,h 公司为其客户提供员工评估服务,这一服务是基于对客户公司的员工

     22 详见百度百科:https://baike.baidu.com/item/电子通信隐私法/14486872,最后一次访问 2019 年 5月 31 日。

     23 李睿:《大数据时代的隐私权保护--以信息抓取为视角》,载《信息安全与通信保密》2014 年第 10期,第 38 页。

     24 详见征信宝:http://www.zhengxinbao.com/4031.html,最后一次访问 2019 年 6 月 1 日。

     25 史利娟:《“互联网 + ”时代个人信息法律保护对策研究》,载《法制博览》2019 年第 1 期,第 24页。

     26 详见 Legal Information Institute:https://www.law.cornell.edu/uscode/text/18/1030,最后一次访问2019 年 5 月 31 日。

     27 详见 Law360:https://www.law360.com/cases/59392a642ca3fa3b07000001,最后一次访问 2019 年 5月 31 日。

      11 信息抓取而进行分析的,但 h 公司在获取这些信息时并无 L 公司的许可。2017年 5 月,L 公司要求 h 公司停止其未经授权而抓取用户公开信息和其他违背 L公司用户协议的行为。L 公司认为 h 公司未经授权的数据抓取行为侵犯其用户的隐私权。法院最终支持 h 公司的诉讼请求,对 L 公司阻止 h 公司的数据抓取技术获取信息的行为作出临时禁令。

     这里是因为法院认为 L 公司具有市场支配地位,其掌握的信息对 h 公司这类数据采集为产品基础的公司而言是不可或缺的,这符合了“必要设施原则”,也就是说,一旦某设施被认定为“必要”之后,拥有者必须承担以合理条件开放该设施的义务。L 公司不应以对方的数据抓取无授权为由而拒绝开放,不会触犯 CFAA 中关于越权访问的规定。而且 h 公司获取用户的公开信息没有涉及隐私权的范畴。

     法院通过此案,确定了以数据抓取技术获取公开信息,不会触犯 CFAA 规定的原则,所以说其第 2 条所指受保护的计算机中的信息信息,不包括用户个人的公开信息。而且此案中援引了反不正当竞争法来规范数据抓取行为,法官认为,LinkedIn 对 hiQ Labs 数据抓取技术的禁止,利用其在社交领域的市场支配地位,影响了 hiQ Labs 对职员数据抓取领域的市场占领和商业利益,该侵害不可修复。正是出于处罚 L 公司的不正当竞争行为,法院才对其反爬虫措施发布了临时禁令。

     在 EarthCam 与 OxBlue Corporation28 (以下简称为 E 公司与 O 公司)的争端中,两公司的营业范围都是经营影像器材和解决方案,被告 O 公司登陆了原告 E 公司某用户的账户密码以帮助该用户解决一些技术问题,O 公司登录了后抓取了大量 E 公司社群论坛上的图片。法院支持了 EarthCam,尽管在 CFAA 中没有关于用户不得与他人共享账户信息的规定,但是 E 公司的网站上却有明确说明,用户出借个人账户信息属于违反使用条款的行为。所以法官认为,O 公司的行为构成了 CFAA 第 2 条规定的“超越授权访问”,因为网站的登陆端只授权给单一用户使用,其他人用当然超越权限。这里确定了违反了 E 公司事先声

     28 详见 Law360:https://www.law360.com/cases/4e1dac64ca42e24ea5000003,最后一次访问 2019 年 5月 31 日。

      12 明的最终用户许可协议(EULA)29 ,可以被认定为“超越授权访问”的规则。

     (二)我国反不正当竞争法对不当数据抓取的规制 尽管多部法律中都能体现对数据抓取造成侵害的规范,这里我们主要研究的是我国《反不正当竞争法》中的体现。目前我国的《反不正当竞争法》对数据抓取行为没有明确规定,只有第 12 条提及对互联网有关行为的规范,但并没有详细涉及数据抓取行为,只能将其涵盖在第 4 款的兜底条款里。不过,实践的判例中常被援引的还是第 2 条“经营者在生产经营活动中,应当遵循自愿、平等、公平、诚信的原则,遵守法律和商业道德”。30

     在这些案例中,法院综合反不正当竞争法、民法、商业道德等进行分析,对反不正当竞争中数据抓取的规范提供了判例。

     1.新浪微博诉脉脉31

     在新浪微博诉脉脉不正当竞争一案中,被告北京淘友天下技术有限公司、北京淘友天下科技发展有限公司发布的社交移动软件脉脉上线之初与原告微梦公司所经营的新浪微博合作,用户可通过新浪微博账户注册登录脉脉。由此脉脉获得了新浪微博用户的 ID、头像、标签、性别、好友关系等等信息,对脉脉所开发的领域,也就是员工社交、打通职场人脉这一市场提供了便利。但经过微梦公司调查发现许多未注册用户的信息也出现在脉脉后台,双方终止合作关闭 API 端口后这些未经用户和新浪授权而获取的信息也没有在合理期限内删除。

     微梦公司认为脉脉软件存在非法抓取、使用新浪微博用户等信息,以及非法获取并使用脉脉注册用户手机通讯录联系人与新浪微博用户的对应关系的不正当竞争行为。两级法院支持了微梦公司的主张,但并没有以微梦公司所提出的侵犯其商业秘密,而是主要以《反不正当竞争法》的第 2 条作为依据。

      29 最终用户许可协议指的是一家公司的软件与软件的使用者所达成的协议,此协议一般出现在软件安装时。如果使用者拒绝接受这家公司的 EULA,那么便不能安装此软件。

     30 曾雄:《数据不正当竞争纠纷的司法实践 —现存问题与解决路径》,载《信息安全与通信保密》2018 年第 11 期,第 70-73 页。

     31 参见:北京淘友天下技术有限公司、北京淘友天下科技发展有限公司与北京微梦创科网络技术有限公司不正当竞争纠纷上诉案((2016)京 73 民终 588 号)。

      13 此案中法院把用户信息作为主要保护对象,脉脉抓取的内容仍属于开放性信息,尚不足以定性为新浪微博的商业秘密,作为用户个人信息保护更为妥当。淘友公司通过不当获取新浪微博用户数据,取得了竞争优势,破坏了互联网行业,所以法院认为淘友公司获取新浪微博信息的行为存在主观过错,违背第三方通过 API 获取用户信息时应坚持的“用户授权-网站授权-用户授权”的规则,违反诚实信用原则和互联网行业中的商业道德,故其行为构成《反不正当竞争法》第 2 条下的不正当竞争行为。

     2.大众点评诉百度地图32

     原告上海汉涛信息咨询有限公司经营下的大众点评网是 UGC 模式经营的,所积累的信息是由用户产生,但在被告北京百度网讯科技有限公司旗下的百度地图甚至百度的其他产品搜索后,能获取大量来自大众点评网的信息而不必经过大众点评网的前台,汉涛公司认为百度公司行为构成不正当竞争而诉至法院。

     法院认为,百度公司在其产品中使用大众点评网信息的数量、比例及使用方式,已对大众点评网的相关服务构成实质代替,具有不正当性,其行为必然会损害汉涛公司利益,显然百度公司的行为已经违反诚实信用原则和公认的商业道德。虽然涉案的评论信息确实是汉涛公司的劳动成果,但由于信息并非法定的权利客体,对于百度公司未经许可使用或利用他人的行为也不能当然的认定为构成不正当竞争。不过法院势必也考量到保护汉涛公司的利益,平衡数据获取的必要限度,这里百度公司的行为对大众点评网造成确实的经济损失,抢占其应有的市场份额,对其经营内容造成了实质代替,超出了正常获取数据的必要限度,严重损害了汉涛公司的利益,并破坏了公平竞争的市场秩序,其行为构成不正当竞争。

     3.酷米客诉车来了33

     深圳谷米科技有限公司经营“酷米客”app 实时提供公交信息,该公司除

     32 参见:上海汉涛信息咨询有限公司诉北京百度网讯科技有限公司等不正当竞争纠纷案((2015)浦民三(知)初字 528 号)。

     33 参见:深圳市谷米科技有限公司与武汉元光科技有限公司不正当竞争纠纷案((2017)粤 03 民初822 号)。

      14 了通过与深圳公交公司合作获取公交实时信息,还在公交车上安装 GPS 进行定位以提高准确性,由于这不仅包括设备投入,还存在损毁、维护、对运营商的付费,所以是一笔不菲的前期投入。武汉元关科技有限公司运营下的“车来了”也是相同功能,只是由于其信息来源是深圳交通运输局,导致其提供的数据存在延迟。为了提高数据的准确性,被告元关公司于 2015 年 11 月至 2016 年 5 月内,通过爬虫技术爬取了原告谷米公司服务器内的有关数据用于“车来了”的运行,并实现了市场份额的扩大。

     法院在判决书中认可了谷米公司对所获数据的所有权,通过后台对数据的整合、分析、前台呈现,能够实现将更为准确的数据变现为用户黏性提高,进而实现占据市场有利地位。所以这些数据是具有经济价值存在的,作为数据的所有者,谷米公司完全享有对这些数据的占有、使用、收益、处分权利,而排除未经授权的元关公司的盗取数据行为。

     根据上文中对大众点评诉百度的案例,车来了通过爬虫技术直接呈现了酷米客中的同类数据,达到了替代酷米客功能的作用,进一步破坏了酷米客的市场竞争优势,等于是非法获得了对谷米公司数据的使用、收益权,违背了诚实信用原则,构成了违背反不正当竞争的要件。

     4.淘宝诉美景公司34

     淘宝(中国)软件有限公司的“生意参谋”产品是为淘宝、天猫的商家提供数据参考帮助商品推广的,通过使用大数据进行对用户使用痕迹的收集、整理、分析、演算,实现对商品受众的刻画,从而方便使用商家推销产品。而安徽美景信息科技有限公司通过运营“咕咕生意参谋众筹”网站,提供远程登录帮助用户获取对“生意参谋”的使用权利,对淘宝公司这款产品的正当推广、使用造成了不便。

     法院通过对网络用户信息、原始网络数据、衍生数据的分析,认为淘宝在开发这一产品后,对产品中运算所得到的信息结果应当属于衍生信息的范畴,具有商品的交换价值,属于淘宝公司可以处分的无形财产,应当得到保护。

      34 参见:淘宝(中国)软件有限公司与安徽美景信息科技有限公司不正当竞争纠纷案((2017)浙8601 民初 4034 号)。

      15 而美景公司的行为,侵犯了淘宝产品的正当使用权益,在使自己的用户获得相同生意参谋的使用效果情况下,就等于损害了淘宝应当获取的这部分用户使用收益。在未经淘宝允许时而擅自以他人产品牟利,并构成对生意参谋的实质替代,损害其市场优势,违背诚实信用原则之余,造成了不正当竞争行为。

     综合以上几个案例,不难看出当下在尽力规范数据抓取行为,不仅是保护公民个人的隐私权、信息权,也保护企业的正当竞争权。对数据抓取技术的使用者,其抓取数据时要符合相应规定,给予公民全面考量授权的权利。在企业之间的数据抓取过程中,对信息的流通也要适度,尽管信息不能作为权利客体来保护,但是其价值决定了企业的擅自抓取行为也是要受市场秩序、商业道德乃至《反不正当竞争法》的规制的,在信息流动、交换过程中,也要尊重基本规范,合理抓取使用数据。

     四、对不当数据抓取行为的规制建议

     (一)借鉴他国内容改善不当数据抓取行为 1.完善立法等保障制度 在反不正当竞争法中没有明确涉及到数据抓取行为,在实践中也常常利用第 2 条这种笼统的条款,难免有滥用之嫌,尽管第 2 条作为原则的利用是无可争议的,但这种较为抽象的规定,适用能否适度在实践中也常常构成问题。不过在最高法院对“海带配额”不正当竞争案35 的法律引用中,对第 2 条的适用作出解释,从而对其他法院在新型不正当竞争案,如利用数据抓取不正当竞争中适用第 2 条做出范例。在反不正当竞争法司法解释当中也没有对这方面进行规范,所以最高法院在做出指导性案例的同时,也可以出台相应司法解释进行指导。

     虽然第 12 条中的兜底条款希望能够解决互联网领域出现的新型不正当竞争行为,欠缺立法明确规定还是力度不足,执法部门例如工商管理总局可以对

     35 参见:山东省食品进出口公司、山东山孚日水有限公司、山东山孚集团有限公司诉青岛圣克达诚贸易有限公司、马达庆不正当竞争纠纷申请再审案((2009)民申字第 1065 号)。

      16 这一条款进行细化,通过部门规章将互联网不正当竞争行为列举,援引现有案例,例如利用数据抓取技术进行不正当竞争等对新型不正当竞争行为解释。

     此外,我国在数据抓取的豁免上没有相应的规章制度进行规范,在法规具体适用的过程中,或许可以参考 2014 年欧盟 29 条工作组发表《关于合法利益的指导性意见》,指导意见中指出合法利益豁免并非是同意机制的补充,而是并列选择,企业可以在同意和合法利益两个合法依据之中任选。29 条强调了信息的使用价值,更加灵活,也更适应大数据时代,在我国的具体应用中,可以借鉴欧盟概念,将合法利益规定为“数据控制者或第三方的合法利益”,我国数据保护部门可制定详细清晰的平衡测试指引,并出台一系列示例,进行类型化分析,为个案分析方式的不确定性提供一定的参考依据。36

     目前我国对数据获取方的规制还不够完善,尚不能达到欧盟所确立的水平,需要在立法方面提高对经营者收集、管理、更改、使用数据等行为的管理水平,要求数据的处理必须以合法、公正、透明的方式,并且要符合必要限度,仿照《一般数据保护条例》 (GDPR),以综合的方式保障用户的个人信息权和隐私权,并最终形成较为完善的信息管理保障体系。

     根据英国 1998 年颁布的《数据保护法》37 ,以设立数据专员办公室的方式来应对不当数据抓取行为,我国政府也可以考虑是否建立专门的监督管理机构,对数据收集方进行审批、监管。

     2.建立行业自律制度 除了立法规范行业标准之外,还可以考虑根据数据抓取使用行业的灵活性,制定行业标准,达到行业自律的目的。以美国的行业自律为例,立法机构颁布法律法规确定普适标准,行业中达成较高的行业标准,但是其中的数据收集方可以选择是否同意这一标准,并对参与标准的经营者进行一定的优惠条件,一旦企业承诺遵守,其行为将受到行业协会的监督。

      36 谢琳:《大数据时代个人信息使用的合法利益豁免》,载《政法论坛》2019 年第 1 期,第 74-75页。

     37 详见百度百科:https://baike.baidu.com/item/数据保护法案/12516874?fr=aladdin,最后一次访问2019 年 6 月 1 日。

      17 (二)提出改进数据抓取不当的措施 1.监管者需要做出的改变 政府首先要重视个人信息保护的问题,大数据的时代公民信息权、隐私权也是重要的权利,不当数据抓取行为牵涉到的财产安全、精神损失也是重要的社会问题,政府部门需要对此加强保护力度,保障公民权益。

     在改进数据抓取不当行为过程中,首先要对行业问责,对于需要用户提供个人信息的经营主体,应当慎重审核资质,保证其有保护公民信息的能力;其次政府要明确行业标准,不允许数据收集方过度获取用户信息,贩卖、交换用户信息,无权但却强行获取用户信息的行为;对行业加强监管和行业自律的建设,不仅要对行业不规范行为加以惩戒,还要鼓励行业自律,提高行业内的信息保护水平。

     政府在自行进行公民数据抓取的过程中,要加强对平台的建设,保障平台的安全性,大力监管后台数据信息,保障政府的信息保护公信力。38 最后,政府还要加强对公民的信息安全教育,提高公民对数据保护的警惕性。

     2.运营商等数据收集方可以改进的问题 运营后台可以对自身的代码进行规则,从根本上防止个人信息泄露,专业的方式是在互联网上创建标识层,对用户需要提交的信息进行严格控制,用户可以在不使用后选择标识层自动消息以消除用户信息。同时,后台可以加大资金投入,提高硬件设施,以技术手段保障用户信息。39

     数据抓取技术的使用者在程序运行时,需要严格遵守网站的 robots 协议,不能干扰网站的正常运行;在设置抓取策略时,要注意避免抓取可能构成作品的视频、音乐等数据,对可能有著作权等权益的内容也要审慎抓取;在使用、传播抓取内容之前,要注意审查,如果发现有用户的个人信息、隐私等泄露,要及时收回并止损。

      38...

    • 范文大全
    • 职场知识
    • 精美散文
    • 名著
    • 讲坛
    • 诗歌
    • 礼仪知识