这是关于互联网过去和现在的一个想法。
1/网络和世界的位镜我和很多朋友讨论过朴素的问题。 在你眼里,什么是互联网?
要回答这个问题,你必须先回答另一个问题。 为什么出现了互联网?
在我看来,这个世界是由三个要素,即物质、能量和信息构成的。 那么什么是信息呢?
根据信息学的创始人CE Shannon在“信息论”中给出的定义,信息对事物的运动状态和存在方式是不确定的记述。
人类获取信息的过程是消除不确定性的过程。 由于描述信息混乱和不确定性的概念是“信息熵”,人类获取信息的过程也可以看作是“信息熵减少”的过程。
二元源的信息熵
成为大人后,通过获取信息可以从“不知道”到“知道”。
人类为了在这个世界上生存下来,我们的基因使我们“设计”,成为了高效的信息获取和处理系统。 例如,我们(或者所有的灵长类)使颜色识别能力进化,我们的眼球能够识别380~780nm波段的光谱,具有根据颜色识别食物、寻找隐身、感知危险的能力。
当然,这是一种非常基础的信息获取能力,在人类数百万年的进化过程中,为了满足我们社会组织的需要,我们发展了更加复杂、高度抽象的信息获取和理解能力,即对文字、画、音乐等信息的处理能力。
简单来说,获取信息对我们来说很重要,这和互联网有什么关系呢?
现在我们需要了解两个概念。 一个是信号,另一个是信道。
传达信息
信息始发者(源)发射经由介质携带的信息(信道),并且使得信息的接收者(宿)接收该信息。
一举栗子,你说的一句话(这句话里含有信息)就变成了声波信号,通过空气这个频道传到我这里,被我听到,这就是信息传递的过程。 在此过程中,信道中存在“噪声”,噪声干扰信号,导致信息传输的变化,从而导致信息传输失败。 因此,不同的信号传输形式对于不同的信道存在相对信息传送的物理限制。 比如说,如果你在前面一公里说一句话,可能听不见。
因此,信号不受干扰的传输距离极大地影响了我们能够维持社会组织的效率。
因此,为了尽可能远距离地传播/获取信息以避免最大程度的保存信号受到干扰,我们人类发明了各种技术。 迄今为止,传递信息的最先进的技术工具是“互联网”。
以上,如果在大学本科读过情报学的话,基本上第一课就是这样说的。
但是,仅仅了解工具的水平,我们对互联网的理解是不够的。 当互联网传递信息时,互联网不是单方面的传递,而是实际上因为互联网拥有向现实世界中的任何人传递和获取信息的能力,所以互联网形成了“网络”。 该网络尽可能提取世界上所有已知的具体、客观和抽象的主观信息,将该信息映射至因特网并以电信号通知它们。
所以,我经常说互联网是现实世界的比特(比特,信息单位)镜像。
然后,该位镜上的信息以“光速”传递。
S=VT
我们知道这个简单的公式意味着距离=速度*时间。 简而言之,一旦以光速传输信息,同时获得信息的半径距离就非常长。 你听说过“地球村”这个概念有多长? 在网络刚到中国的十年里,人们都很喜欢谈论这个概念。 有点土,这句话确实很有形象。 地球变成了村庄。
起初很好啊。 我们获取信息的半径扩大了,在电脑和互联网上完成了“进化”。 但是,我们并不一定习惯这种变化。 因为人类面临的环境自文明诞生1万年以来,首次从“信息不足”变成了“信息过载”。
事实上,互联网的发展过程可以整理以下两个主要上下文
互联网上的信息越来越多
越来越多的人利用互联网。
这两个主要脉络本身相互构成一个闭环。 也就是说,越来越多的人在网上制造、分发、卷入,网上的信息越来越多,利用它的人越来越多。
到了2019年,全世界的网民数量正好超过了40亿人,其中不到9亿人是中国网民。 你知道网上有多少信息吗?
资料来源: IDC,2017年《数据时代2025》白皮书
在2017年,IDC (国际数据公司)预测,当时互联网上的信息约为ZB(1ZB=1兆GB ),到2019年约为2倍。
2019年全球数据量
粗略计算,理论上网络用户平均被分配给1ZB信息。 当然,实际情况不是平均主义,这里只是容易理解。 我想说,即使我们行使这种平均主义,你也不能在你短暂的人生中完全接受这些信息。 而且,在重复消耗的信息海洋中,今天的你一生需要在40ZB的信息海域寻找,只是需要的几十TB。
你能得到的信息超过了你能处理的信息上限。 这就是信息过载。
互联网的先驱其实很早就注意到了这个问题。
世界上第一个网站
http://info.CERN.ch/hypertext/www/the project.html
web ( www )的父亲Tim Berners-Lee在发明web的同时,还发布了世界上第一个网站。 该网站利用超文本技术连接CERN (欧洲核研究中心)的各研究室,并使用超文本(即后续链接),因此人们可以简单地阅览汇总的信息。 1991年8月6日Tim Berners-Lee公开了这个项目,这一天也被认为是网络的诞生。 该网站介绍了超文本的规范、网站的启动详细情况、浏览器的安装使用等信息,后来该网站还收录了其他网站的例子,可以说是世界上第一个网站目录。
从这一天开始,访问网站的人(或者你知道的因特网)有权创建与自己的图形化网站相对应的http网站。 并且,采用了更自然拼写的http地址比以前的FTP地址更容易访问。
当然,在网站诞生的时代,Tim Berners-Lee已经尝试做万维网网站目录的工作,但是http网站随后爆炸性地增加,这项工作已经需要专门机构。 所以从那个时代开始,开辟了网络信息发布的长途。
我们可以将互联网信息传播的模式大致分为4个时代,即主导信息传播的模式流行的时期
分类索引-门户时代
搜索引擎-搜索时代
订阅兴趣-SNS时代
推荐算法-Feed时代
除了这4个时代以外,还排列了长期存在的“高热更新-社区热帖”模式(该模式在国内百度贴吧在检索时代崛起,曾经成为非常重要的信息发布模式)。 需要注意的是,以上时代产生的信息传递模式,多数是伴随着相应的技术变革的应用而产生的,其背后伴随着商业模式的彻底的进化革新而兴起了网络时代。
这些信息发布模式的进化形成了不同时代的大型互联网。 但是,这些模型也并不完全优先,新的信息传播模型往往与早期模型向后兼容,通过商业模型的创新,后者的主导企业把前辈推到地面上,摩擦(至少在一定程度上打破了前辈的领导地位)。
2/分类索引-门户时代&搜索引擎-搜索时代公告栏论坛和搜索引擎技术诞生的时间早于网络诞生,但基于生产力的应用必须适应时代发展的客观规律,网络诞生初期,主导互联网世界信息传播的是搜索引擎技术和公告栏论坛
第一个网络分类索引服务虽然不是雅虎,但是最有名最成功的案例确实是雅虎。
1994年第一版雅虎!
这位华裔企业家杨致远创立的网站,在有效的管理、激进的市场战略下,于20世纪90年代中期迅速打败了他的主要对手,成为世界上最重要的网络门户(对,在国内曾被称为四个门户的新浪、搜狐、网易、腾讯,最初是雅虎)。 的copycat )。 “门户”这个概念可能对现在的年轻人来说并不陌生,但对当时的人来说,这句话的形象性描绘,是很多人连接网络的第一步。
今天的人们,在25年前网络刚刚诞生,没有搜索引擎的时代,如果人们在寻找什么“信息”,也许很难想象人们是怎么开始的。 雅虎! 这是手工归纳分类,手工收集的分类检索目录网站是在互联网上很快发现新网站的地方。 把这样的网站看作“黄页”(收录了工商企业电话号码的号码簿),或者在一定程度上是雅虎! 网络黄页(马云先生想成为网络黄页,后来杨致远的投资,并非没有理由)。
人的想象力不是无产的。 我们总是根据现有的东西,结合一些变化的倾向,思考未来。 对于那些从未见过未来的人来说,将所有网站的信息汇总起来,参照已经存在的电话黄页进行“物化”的设计产品是最合理的。
雅虎! 其商业模式非常粗鲁而简单,即销售广告,准确地说是销售网站上的banner广告。
1997年雅虎! 搜索框上面的汽车banner广告
当时的雅虎! 要增加收入,在主页上(包括每个索引的目录页的大分类页)增加banner的广告位(增加Ad Loads ),同时将单个广告卖得更高(提高Ad Price )也很简单。 雅虎! 在广告销售取得极高成果的同时,大量投入市场广告,激励销售和教育广告客户。
2002年雅虎! 主页上的广告banner
早期雅虎! 制作分类索引的信息发布模型成功后,产品形态迅速发展,首先在1995年结合了检索功能,但是这个检索与以后的检索引擎不同,主要是用于分类检索的快速检索,检索结果多直接指向某个网站(这个详细情况以后再进行检索) 96年雅虎! 开始邮件服务后,将商业触角扩展到新闻信息服务(这个服务等同于以新闻媒体报纸为目标的业务)。
当时,作为世界上最大的互联网门户、互联网目录、电子邮件地址和新闻信息网站,雅虎市场价格一次超过1000亿美元,现在的谷歌和中国四个门户都有雅虎
然后,将来结束门户时代的搜索引擎出现了。
严格来说,搜索引擎技术诞生于网络前一年,现代搜索引擎的前身是90年出生的Archie,是以文件名从FTP主机中搜索文件的技术。 1994年,首次使用现代蜘蛛爬虫技术的搜索引擎Lycos诞生了。 四年后,我们认识的谷歌也诞生了。
这些搜索引擎与分类索引的门户的最初区别在于,获取网络信息的方法不同。 分类索引是手动输入的方式,搜索引擎使用蜘蛛爬虫程序自动提取信息。 另外,人工分类的目录中主要收录了网站,蜘蛛爬行的是各自具体的网站。 对于用户来说,前者需要访问网站并继续自己寻找信息,后者一步一步,方便快捷。
显然,搜索引擎获取网络信息的效率远高于分类索引。 那么为什么最初不太喜欢搜索引擎呢? 因为早期的搜索引擎可以爬上很多东西,但是在很多相关结果中,搜索引擎不能正确地“推测”哪个是你想要的结果。
谷歌之所以迅速崛起,并不是因为他们热情地访问了网页和产品的简单设计。 早期的胜负手从谷歌创造性的东西重新定义了检索结果的排序方法。
谷歌的创始人之一,Larry Page发明了PageRank算法。 用到页面的链接数量测量页面的价值。 谷歌致力于搜索结果的优化,使他们独特。 事实上,由于PageRank算法与此后的Hilitop算法、HITS算法、TrustRank算法、处理缺陷页的SandBox (沙箱)等技术相加,谷歌在2000年左右是最引人注目的信息投递效率
虽然早期的谷歌技术很先进,但作为一家技术公司,他们暂时不能和大量用户和大量现金的雅虎在一起! 直接正面对抗。 实际上他们不仅没有对抗,谷歌从2002年到2004年雅虎! 检索技术的独家外包。 采用谷歌技术的雅虎! 体验快速提升,点击量快速增加,大雅虎! 乐于向前看,完全没有意识到这个弟弟成了自己的掘墓人。
作为雅虎! 的迷弟,谷歌的Larry Page曾经试图把谷歌的前身BackRub卖给雅虎! 2002年雅虎! 我曾经花了30亿美元收购谷歌。 如果不是因为谷歌谈判了50亿美元,雅虎! 您有放弃这笔交易的嫌疑,世界上的互联网历史几乎都在改写(这样的故事在互联网上真正上演)。
98年第1版Google! 模仿雅虎! 还有感叹号
谷歌早期团队照片
让谷歌完成雅虎! 超越的是革新的商业模式AdWords (关键词广告)。 谷歌成为每个检索出的关键词的潜在广告媒体,每个检索结果页面都是广告收入的来源。
我们之前说过,互联网信息传播时代的王朝交替,主要以两个要素为中心
信息发布技术的应用进步
企业模式创新升级
在雅虎! 广告最初是在纸面上看热量的banner的位置上卖热量。 这种商业模式实际上与卖电话簿的广告和卖报纸的广告没有什么区别。 销售广告的收入上限主要取决于用户可以访问的页数,不同页面的热量决定价格级别。 为了多卖广告,你必须在最好的地方添加广告区。 主页是最好的地方,为什么所有早期门户网站的主页看起来都像寸土金市中心一样拥挤。
并且,为了进一步增加广告收入,每个广告网站缩短广告的播放时间,加上轮播的广告次数,随着广告网站的炎热,销售变得和炒金广告网站和时段的价格,卖电视广告一样。
在那个时代你可以成为雅虎! 赚了不少钱。 谷歌完全打破了这种商业模式。
AdWords的创新源于以下两个方面:
一种新的评价模型
新型广告位设计
Adwords评估方法是在用户搜索关键字后,单击搜索结果来计算广告收入(即着名的CPC评估)。 这样,广告的效果就可以切实监视,一次支付的价格非常低,发布广告的战略变得非常灵活,有机会向支付不了巨额广告费的中小企业发布网络广告。
Adwords的广告网站不再是混乱的广告地图和弹仓,而是直接融合搜索结果,提高广告的转换效率,使广告客户满意。 同时改变广告载体,与广告网站的页数无关,世界上有几个词,理论上有几个词对应页的广告网站。 谷歌赚多少钱取决于用户在谷歌中搜索多少次、用户在谷歌中搜索多少次,这取决于谷歌搜索的体验有多好,广告收入模式和产品体验是完全一致的封闭循环,而不是对立关系。
2004年雅虎! 宣布与谷歌的合作关系中断,两者全面开始了战争。 谷歌在搜索业务中完全碾压雅虎! 谷歌公布了对抗雅虎的Gmail邮箱服务的邮箱服务。 技术全面领先的谷歌很快就把雅虎抛到后面,有钱的雅虎! 买了很多网络公司组成了集团军,结果还是没有使用茶叶蛋。 要不是雅虎年! 在鼎盛时期投资了阿里巴巴,这家公司将更早地退出我们的视线。
现在是网络信息发布战争在这里告一段落的时候了。 新模特又来了。
3/订阅兴趣-SNS时代2004年,谷歌大战雅虎! 困惑之时,突然在美国,提出了一个新概念——Web2.0。 意思是第二代因特网,第二代因特网与第一代因特网的最大区别在于,Web1.0是由网络信息经营者主导提供信息服务,在Web2.0时代由用户主导提供产品服务。
说实话,这个概念不太可靠,但是在2004年左右,基于这种理念设计的新一代互联网产品大多出现在今天,Myspace(2003年9月)、Facebook(2004年2月)、flickr(2004年2月)、redder 众所周知,谷歌阅读器( 2005年)、YouTube(2005年12月)、twitter(2006年3月)和tumblr(2007年)等。
这些信息服务产品具有ugc (用户生成内容用户生成内容)的共同特征。 2004年左右,全球互联网用户约达8亿人。 随着大量互联网用户的访问,互联网信息的产生面临着基础性变革。
最初的因特网用户主要是单方面获得信息服务,但随着网络接入用户数量的增加和网络带宽的提高,因特网可以提供更多服务。
从最初的BBS产生的社区论坛,每个人都可以制作自己的个人主页(对,最初是个人网站的变种,个人主页),可以共享自己喜欢的照片的网络相册服务,可以共享自己拍的沙雕视频的网络工作室……
互联网将这个词的原理意思——人与人联系起来,开始看到个人发表的信息。
因为信息的发布方式发生了根本性的变化,所以信息的发布方式也必须改变。 在Web1.0时代,访问互联网获取信息的最短路径是汇集信息的门户和搜索引擎,但现在用户的选择增加了。
无论是接近媒体形态的入口网站还是接近工具形态的检索引擎,在使用者使用时,都可以通过一个中介获取信息,直接预订,使用者可以通过信息中介,从信息源直接获取信息。
首先,我要谈谈信息传播方式的变化,即RSS。
1999年,开发了一种基于XML的新协议RSS,其最初代表资源描述符框架( RDF )站点摘要,即RDF站点摘要。 是可以将按照rdf的规则记述的站点的最新摘要推送给用户的技术。 之后,发明本合同的网站公司( Netscape、web网站浏览器)采取RDF文件的形式,该技术变成了更富有的网站概要,即网站可以向用户推送网站概要的技术。
之后,美国的互联网用户开始流行在个人网站上写Weblog (网络博客),或者用我们更熟悉的名字Blog——博客来替换。 当Blog遇到RSS技术时,会产生新的订阅服务。 我是RSS收藏阅读器。
与以前的门户和搜索不同,RSS读取器是完全个性化的,用户读取的内容取决于用户的订阅列表。 这个设计是划时代的。
国内用户最熟悉的Google Reader
另一方面,在信息的发送方式方面,像Wordpress这样面向迅速Blog的启动工具已经存在,但是对一般人来说,制作网站依然是有阈值的。
那么,有哪些产品能够满足您的个人网页以及在不知道技术的情况下建立个人网站的需求呢? 因此,2002年,世界首个社交网络服务( SNS、Social Network Service )最早的个人主页产品Friendster诞生了。
Friendster很快遇到了自己最大的竞争对手MySpace,在与MySpace的竞争中输了。 尽管MySpace最初是像素级的Friendster产品。 由于MySpace错误,用户可以更改前端UI的HTML,从而自定义其个人主页的颜色、壁纸和背景。 因为这个“功能”受到很多青少年用户的喜爱,很快就成了爆炸金(对,QQ空间是MySpace的copycat )。 并且在MySpace的高速产品和技术的反复下,薄弱的Friendster打出了美国市场,专注于海外市场( Friendster曾经是东南亚最受欢迎的SNS )。
但是MySpace也没什么好笑的机会,世界上最大的SNS Facebook诞生于2004年。 但是,刚诞生的Facebook并不比Myspace有更多的优点。 其实相反,当时的MySpace更加酷,总部设在洛杉矶好莱坞的MySpace与流行文化的趋势标志相似(其实在当时人眼里,MySpace有2017年颤抖的感觉,起点的历史也相似)。
很多人认为这与MySpace战争Facebook最后一次被淘汰,2005年他们的母公司Intermix在默多克出售的新闻集团有很大的关系。 这种想法多少有些道理,但我们深入思考的话,Facebook自身的努力可能是更大的原因。
Facebook和MySpace传递社交信息的方式不同,Facebook在2006年在线提供了新的Newsfeed功能。 该功能当初的汉语翻译被称为朋友动态,但随着该功能的进化,现在有了更有名的称呼——信息流(初期的信息流与今天的信息流的差异其实很大,这一点将在后面会议上谈论)。
但是,发明这种“信息流动”功能的实际不是Facebook,而是Twitter ( Twitter自己最初可能没有意识到)。 如上所述,RSS可以通过订阅功能订阅blog列表以查看blog更新,但是较晚出现的2006年推特将进一步发展这一设计,超出“订阅列表”设计,在推特网站内发布信息 信息的表现形式被限定为140字以内的长度(因为足够短,用户可以读取或公开),按照时间顺序( timeline )直接表现订阅信息的流动,用户决定读什么是最初的“信息流动”的设计的由来。
另外,当时也有人不仅改造了信息发布模式的设计革新,还通过带宽的提高,开始了图像共享的flickr和动画共享的YouTube等信息发布媒体的升级。
这些SNS和订阅服务之所以对谷歌这样的搜索引擎构成最大的威胁,是因为谷歌不能像以前那样方便地抓住网页的内容。 把信息看作水,SNS、照片、视频共享网站是蓄水池,谷歌这样的搜索引擎是航运局。 每当上游有蓄水池时,如果切断通往送水站的输送管路,就会失去送水站的价值。
年轻时的商务网站本身没有流量,服务也不频繁,服务用户每次都必须离开搜索引擎,但像SNS这样在自己的网站内闭环并具有大量UGC动态信息的网站,用户几乎每天都登录,几乎是外部送水 在谷歌,向Facebook出售业务几乎成了交易。 并且,新追加的因特网信息,由于这些蓄水池的内容,如果谷歌不能控制蓄水池的话,就连和Facebook之间谁的发言权大都不知道。
Google停止Google Reader的业务,开发Google+(Google自身的社交平台,看起来与腾讯当时的腾讯微博和当今的微观相似。 有用巨额资金收购,连续10年补助巨额损失的YouTube (现在世界前三的蓄水池)。
但是,对搜索引擎的好消息是,在订阅SNS的时代,SNS这样的新玩家开始掌握增加信息的发言权,但在商业模式的革新中,他们刚出生的时候可能还很薄弱,缺乏革新。 在商业模式中,SNS和social media仍然采用广告模式,但他们在发布广告的效率上,和搜索引擎完全无法比拟。 毕竟广告也是信息。 搜索引擎的商业模式非常先进。 当时的SNS和Social media除了长期使用完整的搜索引擎外,对业务相关数据完全没有好处。
这是订阅的热点——这些新贵在SNS时代已经超越了一些旧门户网站和传统的非互联网媒体行业。 搜索引擎的业务基础完全没有动摇。
但是,使用时间长短的优势也给新贵族们留下了希望,直到新的时代到来,新的大杀戮器被研究出来。
4/推荐算法——在反馈时代,我们现在知道新的大杀手是推荐算法。 但是,出乎很多人的预料,这个大杀手实际上是杀死四方的时代,应该不是新技术。
推荐算法本质上是“向用户推荐信息的算法”。 如前所述,谷歌开发PageRank排名算法来识别哪个页面的价值更大,本质上是广义的“推荐算法”。 因为谷歌将价值更大的页面排在检索结果的上位,推荐给用户。
现在最流行的“协调过滤算法”实际上诞生于90年代,Amazon很早以前就使用了协调过滤算法,而现在使用基于“内容”的协调过滤算法,恐怕是从2003年开始在Amazon中使用的