[問題]模擬關鍵字查詢,購置實驗設備的問題
最近要作「網頁」與「關鍵字」的相關性分析,
問題如下,
機器人爬回來的網頁資料,會存放在資料庫裡。
不會爬回全世界的網頁,但也會有不少的資料,
Q1.請問該準備多少容量的硬碟,才會比較夠呢?
Q2.一部電腦可以接多少台硬碟呢?
若硬碟裝滿了,是不是可以增加硬碟,
讓一台電腦,去接很多很多塊硬碟?
或是每增加一些硬碟,就一定要增加一台電腦?
補充如下,這是內部人員要使用的實驗環境,所以電腦數約2~3台,
平時沒用都會關機,有用才會打開,目前要作的實驗是,
輸入某個「關鍵字」,例如「ptt」,計算相關的網頁數有多少筆,
查詢時間會控制在10秒內
Q3. 請問硬碟與硬碟間的資料可以互通嗎?
例如查詢硬碟A的資料查不到(或查到部份結果),再到硬碟B去查,
查到了,再顯示出來
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.71.206.67
推
11/08 16:14, , 1F
11/08 16:14, 1F
→
11/08 16:15, , 2F
11/08 16:15, 2F
推
11/08 16:18, , 3F
11/08 16:18, 3F
→
11/08 16:56, , 4F
11/08 16:56, 4F
→
11/08 16:58, , 5F
11/08 16:58, 5F
→
11/08 16:59, , 6F
11/08 16:59, 6F
→
11/08 17:33, , 7F
11/08 17:33, 7F
→
11/08 17:34, , 8F
11/08 17:34, 8F
→
11/08 17:37, , 9F
11/08 17:37, 9F
→
11/08 17:42, , 10F
11/08 17:42, 10F
→
11/08 17:52, , 11F
11/08 17:52, 11F
推
11/08 17:54, , 12F
11/08 17:54, 12F
→
11/08 18:10, , 13F
11/08 18:10, 13F
→
11/08 18:12, , 14F
11/08 18:12, 14F
推
11/08 18:21, , 15F
11/08 18:21, 15F
→
11/08 18:33, , 16F
11/08 18:33, 16F
→
11/08 18:35, , 17F
11/08 18:35, 17F
→
11/08 18:53, , 18F
11/08 18:53, 18F
→
11/08 19:17, , 19F
11/08 19:17, 19F
→
11/08 19:17, , 20F
11/08 19:17, 20F
→
11/08 19:21, , 21F
11/08 19:21, 21F
推
11/08 22:24, , 22F
11/08 22:24, 22F
→
11/09 01:07, , 23F
11/09 01:07, 23F
→
11/09 01:08, , 24F
11/09 01:08, 24F
推
11/09 01:45, , 25F
11/09 01:45, 25F
推
11/09 07:42, , 26F
11/09 07:42, 26F
→
11/09 12:01, , 27F
11/09 12:01, 27F
→
11/09 12:03, , 28F
11/09 12:03, 28F
→
11/09 18:26, , 29F
11/09 18:26, 29F
推
11/11 19:43, , 30F
11/11 19:43, 30F
→
11/12 11:18, , 31F
11/12 11:18, 31F