第38章 黑歷史里的財富密码(2/2)
比如:谷歌的前身是创始人之一拉里·佩奇的博士论文项目。
拉里·佩奇当时在想:如果我们可以把整个全球资讯网下载下来,然后只將其中的连结保存下来,那会怎样呢?
佩奇设计了一个网络爬虫工具,它会从佩奇的个人主页出发,一直跟踪它遇到的所有连结,他將这个项目命名为backrub。
这是个疯狂的主意,即使是在1996年1月的时候,全世界已经有10万个网站,这些网站总共含有1000万个文档,它们之间的连结有近10亿条,而且这些数字每年都会呈现指数级增长。
backrub项目很快就占用了史丹福大学几乎一半的网际网路带宽,而且它造成了数次全校范围內的网络中断。
这也是谷歌利用爬虫来做gg由来,这玩意是刻在谷歌dna里的...
这个大胆而复杂的项目吸引了拥有数学头脑的谢尔盖·布林的注意,当时他也在寻找一个合適的博士论文题目。
他兴致勃勃地加入了自己好友的工作当中,隨著这个项目的逐步推进,他和布林想出了一些更为复杂的网页价值分析方法,这些方法採用的依据是指向每个网页的连结的数量和质量。
这时候,他们逐渐认识到这个按照重要性排名的网页索引可以成为一个高质量搜寻引擎的基础。
这就是谷歌诞生的由来。
这个经过改进的项目最初被称为“pagerank”,因为它会对backrub索引收集到的每个网页进行排名。
而且这个名字还体现了佩奇的讽刺幽默感和小小的虚荣心。
“不好意思,它確实是指我自己。”他后来羞怯地承认道,“我其实对此感到有点难为情。”
又比如:由於这个搜寻引擎需要处理海量的页面和连结,所以拉里·佩奇和谢尔盖·布林决定把它命名为古戈尔(googol)——这个词是指1后有100个0。
他们和贾韦德当初確认『youtube』时一样,在瀏览器中输入“google”,发现这个域名仍然可用,於是佩奇想都没想就把它抢注了下来。
?_?是的,这俩斯坦福博士、未来的科技巨头就这么水灵灵的打错字了。
布林后来说道:“我不確定我们是否意识到自己犯了一个拼写错误,不过『googol』域名已经被占用了。
之前已经有人註册了『googol.com』,我试过向那个人提出购买域名的请求,但是对方非常喜欢这个域名,所以不愿意出售。因此我们还是选择了『google』。”
...当然,今日之巨头谷歌的名字源於一次拼写错误和將错就错这些不是重点,最关键的是西蒙看到了这一段:
“早在谷歌成立之前,为了完善谷歌前身pagerank的搜索结果,佩奇和布林就加入了很多因素作为排序权重的参考指標...”
当看到这条消息时,西蒙心臟猛地一跳!
虽然youtube不是搜寻引擎,但谷歌的核心是理解“內容”和“关联”!
文字gg的核心也是基於关键词匹配。
他確实对文字gg应用在油管上有些初步的想法,但具体实现上並不像他和贾韦德说的那样『好解决』。
如果能更深入地理解谷歌判断內容价值和关联性的方式,甚至早期的排序思维,是不是能撬动现有的框架,为视频內容找到一种全新的、更匹配的gg呈现方式?
这些后世网际网路上隨处可见的谷歌算法逻辑,在2004年还是机密,起码用谷歌是搜不出来的。
他无比后悔穿越之前没关心过这些价值万金的內容!但还好,现在也不是没人知道,阿灵顿不就...
正想进一步了解,但文章到这里,突兀地结束了!
后面明显应该有更多內容,甚至可能引出更关键的思路,但下面只跟著一个“未完待续”的標註。
似乎是阿灵顿写到这里临时有事停下了,这篇博文之后也一直没有更新过。
西蒙气得一锤桌子:我tm裤子都脱了!你就给我看这个?
阿灵顿你个断章狗!