概述
本次遷移專案的目標是將廣告投放系統遷移至 AWS,主要涉及在容器叢集中管理客戶端。遷移範圍包括廣告引擎、演算法策略、運營後台、計費平台、廣告庫、廣告投放平台 API 存取服務等完整系統,遷移至 AWS 新加坡區域。Elite Cloud 協助 Archaeologist 理解 AWS 服務,設計雲端架構,並支援專案測試、服務遷移與部署優化。該專案計畫於 2024 年 1 月啟動,並在 2 個月內完成遷移工作,後續持續提供業務穩定性與增量成長的支持。
專案目標
GCP 託管服務遷移
由於 Archaeologist 深度使用 GCP 託管服務,遷移至 AWS 需要專業技術服務商協助匹配對應的 AWS 服務。此工作涵蓋 GCP 至 AWS 服務適配、遷移可行性研究、遷移方法驗證等。因供應商產品、系統架構及部署方式的差異,該遷移與重建工作量相當大。
緊湊的專案遷移與重新部署時程
Archaeologist 尋求具備快速部署與遷移能力的服務商,目標是在 2 個月內完成遷移與部署測試。考量到 Archaeologist 的人力資源有限,以及可能需要較長的資料庫升級測試週期,AWS RDS MySQL EOS 的時間線可能會產生影響,因此需要合作夥伴提供適當的解決方案。
AWS 專業指導需求
為了減少不必要的風險與試錯成本,Archaeologist 希望獲得專業支持,以加速完成廣告投放平台在 AWS 上的架構設計、遷移與部署。
預期專案交付標準
Archaeologist 將根據以下主要標準來評估專案是否成功:
Elite Cloud 為 Archaeologist 提出的架構設計
為了滿足 Archaeologist 的需求,整體業務系統採用了以下架構,重點實施以下方面:

AWS 架構設計考量
運維管理:確保系統穩定與維運效率。
安全性:加強身分驗證、權限管理與日誌監控。
高可用性:透過多可用區部署,提高業務持續性。
效能最佳化:使用自動擴展技術以適應流量變化。
成本控制:精確規劃資源使用,優化開銷。
可持續性:運用 AWS 最佳實踐,確保長期穩定運行。
Landing Zone 規劃
協助 Archaeologist 合理劃分網路層級,使各業務操作易於區分與管理。
保留獨立測試可用區子網,並與生產環境隔離,以確保開發與測試不影響正式運行。
DNS 與負載均衡設計
建議 Archaeologist 採用配置式網域名稱解析方式,使用 EKS 的 Ingress 與 ALB 負載均衡器,確保機器分布於多個可用區。
強化業務安全性、擴展性與容錯能力,降低單點故障風險。
權限與日誌管理
使用 AWS IAM 和 CloudTrail,協助管理 Archaeologist 的權限、操作記錄與帳號威脅檢測。
監控與告警設計
配置 CloudWatch 監測 EC2 狀態變更、健康狀況、記憶體使用率、CPU 使用率等事件。
使用 AWS 託管 Prometheus 收集 EKS 叢集與計算資源監控指標,並與 CloudWatch 整合進行告警與 SNS 郵件通知。
核心業務 EKS 叢集設計
多可用區 Worker Nodes 部署,確保業務可用性。
考量 Archaeologist 促銷期間的高突發流量需求,系統需具備高效的自動擴展與縮減能力。
採用 Karpenter 作為 Kubernetes 自動擴展工具,加速應對資源需求變動,大幅降低運維負擔。
核心業務部署於 EKS 叢集,並透過 ALB Controller Ingress 對外提供服務。
EKS 叢集最小 8 節點,最大可擴展至 30 節點,滿足高峰期需求。
EC2 節點預設配置 GP3 磁碟,可根據需求彈性擴展存儲空間。
節點部署於私有子網,避免對外暴露,提高安全性與控制性。
節點群組的安全組僅允許來自 EKS 叢集與 ELB 的存取,加強存取控制。
遷移成功交付標準
解決方案符合需求。
遷移文件完整且符合要求。
應用程式與數據遷移完全完成。
遷移後功能運行正常,符合業務需求。
按照協議範圍完成遷移設計與實施,並確保切換後業務穩定運行 15 個工作日。
Comments