靠200美元CPU+「白菜价」二手硬件,他在自家洗衣房造了个“迷你谷歌”:能跑20亿网页,总成本5000美元!
创始人
2025-09-15 05:07:56
0

如果有人告诉你:用一台自己拼凑的旧服务器,就能在家里复刻一个迷你版“谷歌搜索”,你可能会觉得是天方夜谭——但在 2025 年,这件事确实发生了。

本次故事主角是开发者 Ryan Pearce。他没有背靠巨头公司,也没有巨额投资,尝试用“低配方式”重走谷歌之路:只靠一堆淘来的二手硬件、一颗不到 200 美元的 CPU、再加上 AI 的力量,在自家洗衣房搭起了一个“迷你谷歌”。

这些Ryan Pearce 打造了两个搜索引擎:

Searcha Page ——常规版搜索引擎(https://searcha.page/

Seek Ninja ——注重隐私,不收集用户数据https://seek.ninja/https://seek.ninja/)。

换句话说用户在页面入搜索请求时,背后的服务器其实就运行在 Ryan Pearce家的洗衣机和烘干机旁。

复刻谷歌来时路校园宿舍变成洗衣房

时间回到30 年前,其实“谷歌搜索”的起点同样寒酸。

当时谷歌刚起步,并没有什么豪华的硬件配置,它的第一台实验服务器容量只有 40GB,运行在斯坦福大学宿舍,机箱外壳还是用大号乐高(Duplo 积木)拼出来的。后来,是在 IBM 和 Intel 的捐助下,谷歌才把服务器升级成小型机架

时至今日,谷歌搜索早已庞大到一个数据中心都装不下。但如果你愿意折腾,用一点巧妙的资源调度,再加上满满的毅力,也可以在一台接近当年“谷歌初代服务器”规模的机器上,复刻一个相当现代的搜索体验——甚至能把它放在自家洗衣房里。

对此,Ryan Pearce 打趣道:

“现在,我洗衣房里的存储容量,比 2000 年的谷歌还大。这想想就太疯狂了。”

某种程度上来说,他是在复刻谷歌的历史路径,只不过场景从校园宿舍换成了家庭洗衣房。

自制搜索引擎:不用云,靠淘来旧服务器

与大部分云计算驱动的项目不同,Ryan Pearce的搜索引擎几乎完全摆脱云,走的是自托管路线

上层主机:主要由旧服务器零件拼凑而成,Ryan Pearce 还给它装了一个简易风道散热。

下层电脑:负责给整个系统提供额外支撑

一开始,这台设备放在卧室由于机器太热也太吵,根本没法睡觉。后来在妻子的“提醒”下,Ryan Pearce 把设备搬到洗衣房,把网线穿墙引进去,从此服务器就一直在洗衣机和烘干机旁。虽然热量问题没完全解决,但至少不会影响生活:“除非门关太久,不然也不会太热。”

这样一台运行在洗衣房搜索引擎性能表现如何Ryan Pearce 介绍除了早期搜索结果偶尔有点延迟(最近几周显著改进),整个引擎的表现让人很难挑毛病结果质量甚至高于预期——背后支撑它的,是一个高达 20 亿条文档的数据库。

Ryan Pearce 还计划在半年内将其扩展到 40 亿条。如果光说数字没什么概念的话可以做个对比1998 年,谷歌还在斯坦福时,数据库里只有 2400 万条网页;到了 2020 年,这个数字已经达到 4000 亿

按现在谷歌的标准,20 亿当然只是“九牛一毛”。但对于一人之力而言,这已经是惊人的成果。

核心秘密:AI 加持的传统搜索

能把“废旧服务器”搞到这种规模,RyanPearce 关键靠的就是大语言模型(LLM)。

“我其实做的还是非常传统的搜索,基本就是谷歌 20 年前的那套。但我加了一点‘调味料’——用 AI 做关键词扩展,以及理解上下文。这其实是搜索里最难的部分。”

所以,虽然 Searcha Page 和 Seek Ninja 都保持着极简的界面,但背后却少不了 AI 的助力。

很多人可能会:“我就是想要一个不用 AI 的搜索。”其实AI 早已深度融入搜索引擎比如反向图片搜索,没有 AI 根本不可能实现再比如谷歌在十年前就上线了 RankBrain用机器学习优化搜索结果微软更是早在 2019 年就透露,Bing 90% 的搜索结果依赖机器学习

因此,当人们今天抱怨 AI 让搜索变差时,往往忽略了一个事实:AI 早已是现代搜索引擎的 DNA。Ryan Pearce的案例则进一步证明:就算是一个人,也可以用 AI 去构建和扩展属于自己的搜索引擎。

二手硬件+顶级 CPUDIY 成本骤降

支撑 Ryan Pearce 搜索引擎的核心,是一颗 32 核 AMD EPYC 7532

现在eBay 上不到 200 美元就能买到

甚至为了进一步省钱,Ryan Pearce 买的还是“质检测试版”芯片补充其实他本可以花同样的钱买到另一颗线程数翻倍的 CPU考虑到会产生太多热量,不适合家用环境放弃了

除此之外Ryan Pearce 低价收购了许多性能可观二手服务器硬件由于企业三年一换机,他们淘汰旧硬件在市场上大幅贬值,性能依然强悍所以只要能接受耗电高,就能用白菜价获得巨大的算力。

Ryan Pearce 正是抓住了这一点,用“白菜价”的旧设备,拼出了一个能跑现代搜索引擎的系统其性能甚至比谷歌早期的一些服务器还强了解整套系统成本约 5000 美元,其中约 3000 美元花在了存储上因为半 TB 内存依然很贵这在 DIY 圈已经是顶级配置。

借助 LLM“补课”:从快速原型到持续迭代

值得注意的是,Ryan Pearce 不是唯一的 DIY 搜索引擎开发者。

例如另一位极客 Wilson Lin 选择了一条完全不同的路线:系统依赖至少 9 种不同的云服务开发了新的数据解析技术,大幅降低搜索引擎运行成本解释道这样整体AWS 便宜很多才能在合理预算内推进项目

这两条看似迥异的路线,能走到如今的规模,其实都得益于一个关键因素:AI。很多人抱怨 AI 拉低了搜索质量,但也正是 AI才让这些个人开发者有机会接近“谷歌级别”的搜索体验。

围绕 AI 的最大争议之一,是搜索引擎是否过度强调它。很多时候,AI 的痕迹直接体现在结果页面上:试图“解释”你的搜索。有人喜欢节省时间,有人则非常反感。但对资源有限的个人开发者来说,LLM 却是快速构建和扩展数据集的必备工具。

Ryan Pearce 为例他拥有企业软件和游戏开发的背景,并不抗拒编程中引入 AI当前搜索引擎代码量已超过 15 万行,加上反复迭代,实际写过的代码应该接近 50 万行他对于AI用法先用 LLM代管某些功能,再逐渐替换成传统实现——这种方式让他能快速搭出复杂系统,然后再迭代打磨。

Wilson Lin 也评价道:LLM 确实降低了门槛。现在阻碍我们挑战谷歌的最大障碍,并不是技术,而是市场。”

“我不会永远呆在洗衣房”

不过,LLM 的复杂度仍超出了洗衣房服务器的承载范围。

于是Ryan Pearce 打造的Searcha Page 和 Seek Ninja接入了 SambaNova 提供的 Llama 3 推理服务,以低成本获得快速的 AI 能力。此外,Ryan Pearce 受益于 Common Crawl ——一个开放的网页数据仓库,也是大模型的重要训练来源甚至在项目开发过程中一度因频繁抓取被 Common Crawl 封禁过。

Ryan Pearce 感慨道:“我真的很感谢他们,希望未来能有所回馈。等我项目做大,一定会少依赖他们。”

当然,也不是所有尝试都成功了。Ryan Pearce 透露,最开始他想用向量数据库来实现搜索,结果失败了:“它确实能搜,但结果太‘艺术化’,就像 LLM 的幻觉问题一样。”

相关内容

科普丨身上突然冒出的小红点...
“洗澡时突然发现腿上长了几个小红点,摸起来有点凸,这是不是得了什么...
2025-09-15 16:30:03
金融支持实体经济力度持续加...
央视网消息(新闻联播):中国人民银行公布的最新数据显示,8月末,社...
2025-09-15 16:30:01
海量财经 | 海澜之家砍加...
海报新闻记者 周凌峰 报道 曾几何时,“男人一年只逛两次海澜之家”...
2025-09-15 16:29:59
抓实学习教育 筑牢作风根基...
抓实学习教育 筑牢作风根基 ——省政协机关开展深入贯彻 中央八项规...
2025-09-15 16:29:54
“没事儿,我们陪您一块儿等...
扬子晚报网9月15日讯(通讯员 何叶子 记者 孙锐)秋意渐浓,温情...
2025-09-15 16:29:52
深圳新小南山隧道左线掘进过...
9月14日,由深圳前海建投集团建设、中铁四局施工的赤湾二路西延段项...
2025-09-15 16:29:50
海淀大钟寺AI先导区探索知...
9月12日,第十四届中国知识产权年会大钟寺人工智能先导区同期活动在...
2025-09-15 16:29:49
于东来再次发声力挺西贝
9月15日午间,胖东来CEO于东来再次发声,力挺餐饮品牌西贝。 ...
2025-09-15 16:29:46
【2025服贸会】知识产权...
知识产权保护办公室工作人员解答咨询 9月14日,2025年中国国际...
2025-09-15 16:29:45

热门资讯

科普丨身上突然冒出的小红点是啥... “洗澡时突然发现腿上长了几个小红点,摸起来有点凸,这是不是得了什么怪病?” “刚三十岁就长‘老年痣’...
深圳新小南山隧道左线掘进过半 9月14日,由深圳前海建投集团建设、中铁四局施工的赤湾二路西延段项目新小南山隧道左线掘进顺利突破69...
田径世锦赛 | 牛春格晋级女子... 9月15日,在日本东京举行的2025年世界田径锦标赛女子撑杆跳高资格赛中,中国选手牛春格晋级决赛。 ...
北京:预计超过50000000... 9月15日,首都“十四五”规划高质量收官系列首场主题新闻发布会举行,介绍了北京市“十四五”时期经济社...
原创 莫... 近日,印度的一个重大基础设施项目引起了国际社会的广泛关注。据彭博社报道,印度计划投资约34亿美元,在...
雷军官宣小米17全面对标iPh... iPhone 17系列正式开售3日后,国产手机宣布“迎战”。9月15日,雷军转发小米合伙人、总裁卢伟...
青海黄河源区确认发现秦代刻石 记者9月15日从国家文物局获悉,针对此前引发广泛关注与讨论的位于青海果洛州玛多县卓让村扎陵湖北岸的石...
斯塔默就反移民示威发声:永远不... 【文/观察者网 王恺雯】移民问题持续撕裂着英国社会。 当地时间9月13日,逾10万人聚集在伦敦参加...
小米16改名小米17本月底发布... 封面新闻记者 雷强 9月15日,小米集团合伙人、总裁卢伟冰发文称,全新小米 17 系列,本月就会和大...
上门服务走进千家万户,一站式平... 上门喂猫、上门化妆、上门做饭......在快节奏时代,时间是最宝贵的财富。数字经济、懒人经济蓬勃发展...