新聞關鍵字搜尋 雛形系統

马上开始. 它是免费的哦
注册 使用您的电邮地址
新聞關鍵字搜尋 雛形系統 作者: Mind Map: 新聞關鍵字搜尋 雛形系統

1. 使用WebService提供Rss

1.1. 緣由

1.1.1. 基於目前使用者的需求,是指使用Google與Yahoo二大搜尋引擎其中有關新聞的搜尋 以關鍵字資料來取得相關資訊,在分析二者的搜尋結果後,應能討論出有關搜尋結果的共有格式

1.2. RSS

1.2.1. 目的

1.2.1.1. 使用RSS的好處是,已經有固定的資料格式,這樣一來我們在取得資料後,在分析與運用上將會比較容易

1.2.2. 問題

1.2.2.1. Google

1.2.2.1.1. 在搜尋某關鍵字後,可以產生該關鍵字的RSS連結

1.2.2.1.2. 但是該RSS連結只提供搜尋結果第一頁的資料,無法提供第二頁以後的資料

1.2.2.1.3. 雖然可以透過Google搜尋偏號,將每頁搜尋筆數設最大值100,仍無法取得100筆後的資料

1.2.2.2. Yahoo

1.2.2.2.1. 在搜尋某關鍵字後,並無提供可以產生RSS連結的方法

1.3. 解決方法

1.3.1. 設立WebService

1.3.2. 將使用者輸入的關鍵字帶入後

1.3.3. 轉換自訂特有的RSS

2. 不使用API

2.1. Google

2.1.1. 目前未提供新聞搜尋API,只提供固定功能的RSS服務

2.2. Yahoo

2.2.1. 在新聞方面提供完整的API,但是提供的是全球新聞

2.2.2. 測式以土石流為關鍵字時,Yahoo全球新聞與Yahoo奇摩新聞結果不相同

2.2.3. Yahoo奇摩雖有For Taiwan的API,但目前在奇摩新聞方面尚未提供

2.3. 基於上述原因,暫不考慮使用API

3. 第一步

3.1. 取得相同Rss

3.1.1. Rss格式

3.1.1.1. 新聞標題

3.1.1.2. 新聞簡述

3.1.1.3. 新聞連結

3.1.1.4. 新聞來源

3.1.1.5. 新聞發佈日期

3.1.2. 我們替Google與Yahoo建立Search2Rss的WebService後 我們得到固定格式的Rss資料

3.1.3. 未來若有其他新聞搜尋引擎,亦以相同方法

4. 第二步

4.1. 建立樣版

4.1.1. 樣版

4.1.2. 樣版是基於每個目標網頁展示資料的格式不同 透過新聞連結,取得目標網頁後 我們可以依照事先定義的樣版取得資料

5. 第三步

5.1. 資料儲存

5.1.1. 因為新聞在目標網頁上有存活期限 我們須將目標網頁資訊儲存至資料庫