RELATIONSHIP WITH ALCHEMY
新聞並非孤立存在,而是無數元素的集合。我們希望在市場中提取其中的核心成分,跨越時間與事件重新調合,在淬鍊中勾勒出更完整的資訊圖景,幫助人們更快看見事件之間的關聯。
THE ALCHEMIST
負責系統核心架構與資料工程。主導金融新聞爬蟲規劃、優化 SQLite 資料庫結構設計以實現高效資料持久化,並建置自動化管道管線(Pipeline)以整合完整資料流。同時負責系統的雲端部署規劃(含 Cloudflare 部署評估),確保平台具備高可用性與擴充彈性。
THE ASSISTANT
本專案中不可或缺的 AI 協作夥伴。主要負責 Python 邏輯編寫、網頁架構設計實作、知識協作與美術設計顧問,並在自動化管線建置中擔任關鍵角色,是系統開發與高效維護中不可缺失的重要支柱。
抓取資料
定時執行爬蟲腳本,自工商時報、鉅亨網以及 Google Trends 抓取今日最新原始財經與趨勢話題資料。
概念附加分類
完全由大語言模型 (LLM) 對原始新聞內容進行深度分析,自動將新聞歸類並標記符合的細項概念標籤,實現精準分流與合併存檔。
匯入資料庫
執行匯入腳本,將新聞 raw 資料與概念標籤排除重複後,整合寫入 SQLite 資料庫中安全儲存。
LLM 概念趨勢摘要
由 AI 代理人整合當日新聞動向,以概念標籤為主題撰寫市場總覽、焦點 Hero 報導與精簡趨勢摘要,並建立情緒熱度指標。
網站呈現與驗證
啟動 Flask 後端服務,藉由前端網頁美觀地展現最新一天的摘要資料與 Marquee 跑馬燈,並完成排版及功能驗證。
這跟直接在 Gemini 上問「幫我整理今日新聞」有什麼差別?
直接在線上詢問大模型通常會面臨資訊雜亂、無法持久化與高額 Token 成本等問題。透過本系統的自動化管線,我們在多個維度上實現了根本性的差異:
-
Token 效率管理
如果把數百篇未經篩選的 raw 新聞直接塞給 LLM,會消耗極其龐大的 Context Token。本系統利用 Python 爬蟲在本地端先進行初步過濾、去重與格式化,再進行精準的語意推理比對,最大程度壓縮並節省了 AI 大腦的 Token 消耗與調用成本。
-
新聞源自主管理
公有大模型的新聞檢索往往來源不明、充斥著內容農場或無效資訊。我們在底層直接管控新聞源,排除付費牆干擾及低質量來源,確保每一筆餵給 AI 的資料都是乾淨、具備高參考價值的財經媒體原始報導。
-
精準類別與主題控管
傳統 AI 通常無法主動辨識您的個人化偏好。本系統能徹底過濾掉政治、娛樂等無關雜訊,並依據自定義的產業細項概念清單(涵蓋 150+ 個細分領域),對新聞進行多對多的精準主題歸納與語意追蹤。
-
個性化呈現與舒適視覺體驗
擺脫一般對話框的單一呈現方式,本系統提供客製化的新聞主控台。透過流暢的介面排版、動態跑馬燈與自動黑暗模式漸變,大幅提升視覺舒適度與讀取效率,讓您在自主定義的平台中,獲得更舒適的資訊瀏覽體驗。