此稿是本人去年在“课前三分钟”的讲稿,现在看来里面的一些句子十分荒谬,现在就当笑话看吧。(有些话在当时改稿的时候删掉了,这边用删除线表示出来)


网络是当今世界我们所熟悉而又不太熟悉的事物。你晓得互联网是怎么运作的吗?我们是怎么上网的?搜索引擎是如何管理如此多的网页的?你的心中也许有许多这样的疑问,希望本次演讲能给你解答这些疑问。

当你在浏览器输入网址并回车,你的手机就通过自身的编辑器对网址、IP地址等等上网信息进行编码调制。简单来说,就是这样,这些信息翻译成机器之间可以交流的语言,其目的是防止数据丢失。然后将数据打包发给你旁边的路由器。路由器先通过查询域名服务器,再将这个信息发给基站。基站其实就是路边熟见的铁塔,它们是移动互联网的桥梁。基站会像神经元一样一路将信息进行传递,直到最后的基站将信息转发给缓存有网站信息的机房,机房会先访问元服务器。什么是元服务器?像百度网盘之类将下载速度视为命根的网站,在将文件存储到服务器时,会先对文件进行分片,也就是将一个文件分成许多个小文件。这些文件碎片存储在不同服务器中。哪个碎片存储在哪个服务器的元数据就存储在元服务器里面。元数据会帮助找到并回传文件碎片,手机内存解调,最后从手机屏幕上显示出来。如果你在此之后点了点按钮或链接,又要重复以上步骤,将网页来回传送。以上仅为绕开电信运营商,且网站有进行缓存的理想状态。

这便上网的过程,万维网通信的基石。

在中国,我们上网便要问度娘。百度是个什么呢?百度在经济学家和法学家眼中是公司、是经济体,在网虫眼里是一个上网方式,而在我眼中是搜索引擎、网络地图、网上订餐等等的结合。而百度搜索值得一提。我们在五年级制作网页的时候,就知道百度的搜索功能是通过表单实现的。什么是表单?就是输入框。其大部分就像填空题里的横线。当你在输入框输入鸡你太美并点击百度一下的时候,百度还仅仅知道你想要关于这类的网页。在此后的1秒内,百度要通过服务器的脚本进行检索、排序、呈现。

我们不讲专业性较高的检索,来谈排序是如何进行的吧。有用过百度的都知道,百度搜索结果的第一名不是百度自家的产品,就是知乎、哔哩哔哩、爱奇艺之类的知名站点。这主要是由什么导致的呢?权重。

权重是什么呢?首先你要了解搜索引擎的目的是什么?是为了让人找到更有用的信息的。权重设置的目的也是这样。一般来说,此前内容权威、优质的网站,此后也会产生权威、优质的内容。搜索引擎将他们赋予高的权重,在下次收入改网站的网页的时候会优先考虑,在搜索呈现中的排名也会靠前。简单来说,高权重相当于一个搜索引擎给网站的糖果、VIP。而降低权重也是搜索引擎对网站比较常见的处罚方式。

现在越来越多的用户使用搜索引擎作为上网的门户,越来越多的网站依靠搜索引擎获得网站流量。搜索引擎也开始承担起引导互联网向好向上发展的重任。

即使有了权重,但搜索引擎直接将包含鸡你太美字符的网页显示出来,也未必太过低级。百度需要让服务器知道鸡你太美的意思。

到这个时候,我们需要离开网络领域,进入人工智能领域。(后面那些话太扯淡了,我都不好意思打出来。事实告诉我们,门外汉是讲不了门里面的故事的)

百度会定期让机器去学习新的网络用语,比如已经收入词典的给力。这样做可以让搜索引擎适应起日新月异的网络潮流、跟上时代、守住市场。

我的演讲到此结束,谢谢大家。


真的,打完这个搞真的非常不可思议。想起自己曾经会花费一个中午的时间来写这个稿,感觉非常佩服曾经的自己。我写完稿之后,还没有上台之前,同学们就开始嘲讽:“这不是课前三分钟,这次课前三十分钟。”