2021年11月25日 星期四

AWS-EC2主機異常,檢測內核崩潰問題?執行個體狀態檢查未通過的故障診斷

AWS-EC2檢測內核崩潰問題 


有一台機器原本連線正常,但是之後發現線路全部不通,沒有做什麼操作,要怎麼排除是什麼問題造成?

 

在實例發生異常時,可以先檢查以下兩個指標,確認是由哪一種狀況所引起的,此兩種異常是不同的場景造成,關於實例狀態檢查可以透過

1.      StatusCheckFailed_System。系統狀態檢查經控實例上某個運行的AWS系統。這些檢查會檢測出需要AWS參與修復的深層實例問題。如果系統狀態檢查失敗,可以選擇等待AWS修復問題,也可以自行解決問題,對於由Amazon EBS支持的實例,也可以選擇自行停止或者啟動。在大多數的情況下,這會導致實例被遷移至新主機。對於由實例儲存的Linux系統,可以終止並替換實例。對於Windows系統,根捲必須是Amazon EBS捲;根捲不支持實例儲存。實例儲存捲是臨時的,實例停止後所有數據都會丟失。

 

2.      StatusCheckFailed_Instance- 實例狀態檢查用於監控各個實例的軟件和網路配置。Amazon EC2 通過向網路街口(NIC) 發送地址解析協議(ARP) 請求,檢查實例的運行情況。這些檢查檢測需要親自參予修復的問題。如果實例狀態檢查失敗,通常必須親自手動解決問題(例如: 重啟實例或更改實例配置)透過內部工具確認,此實例發生不預期的故障,可以從CloudWatch指標”StatusCheckFailed_System”查看

經初步判斷Instance reachability check failed 這個錯誤通常是APP層的問題,透過內部工具Cloud Watch此實例硬件在稍早有發生不預期性的故障,這邊可以透過Cloud Watch查看指標'StatusCheckFailed_System'

 

(StatusCheckFailed_System)

 

由於底層監控有偵測到底層主機異常,主動遷移了此實例,此實例被重啟,發生了內核崩潰的異常,這個可以透過實例的控制台輸出查看

 

[2.860227] rtc_cmos 00:00: setting system clock to 2021-11-24 10:08:01 UTC (1637749999) [3.919154] Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(0,0)

 

解決方法: /boot/grub/grub.conf /boot 目录中缺少 initramfs initrd 映像

方法 1:使用 EC2 串行控制台

方法 2:使用救援实例

 

最後重新設定AMI解決此問題。

 

AMI (Amazon Machine Images)

AMI,其實就是映像檔(Image),它可以將目前的EC2做快速的複製;Auto Scaling(自動擴展)就是搭配這個功能來完成的;另外,我們一開始在建立的EC2時,選擇系統的部份也是用到了AMI功能。

 

參考資料:

內和崩潰AWS文件:

https://aws.amazon.com/cn/premiumsupport/knowledge-center/ec2-linux-kernel-panic-unable-mount/?nc1=h_ls

 

AMI介紹:

https://akuma1.pixnet.net/blog/post/294451990-%EF%BC%88%E4%B8%83%EF%BC%89ami%EF%BC%88amazon-machine-images%EF%BC%89%EF%BC%8D%EF%BC%8Daws%E7%B6%93%E9%A9%97%E6%95%99%E5%AD%B8

 

CloudWatch介紹:

https://aws.amazon.com/tw/cloudwatch/

執行個體狀態檢查未通過的故障診斷

https://docs.aws.amazon.com/zh_tw/AWSEC2/latest/UserGuide/TroubleshootingInstances.html

2021年11月5日 星期五

Amazon Lightsail 配額申請

 

Amazon Lightsail 配額申請

 

AWS網站服務中搜尋Service Quotas然後輸入要申請的服務(EX: Amazon Lightsail)



點選左側AWS服務



然後輸入要申請的服務(EX: Amazon Lightsail)

 





 

找到後點選欲申請配額之項目(EX:instance)










再於右下角點選請求配額提升











在於下方變更配額值的部分輸入欲變更之數值

 



 

完成後,可在下圖紅框處找到配額請求



點入狀態可看到相關工單



EC2和Amazon Lightsail

 

EC2Amazon Lightsail比較

 

Amazon Elastic Compute Cloud (Amazon EC2)

是一種 Web 服務,可在雲端提供安全、可調整大小的運算容量。該服務旨在降低開發人員進行 Web 規模雲端運算的難度。Amazon EC2 Web 服務界面非常簡單,您可以輕鬆獲取和配置容量。使用本服務,您可以完全控制運算資源,並在成熟的 Amazon 運算環境中執行。

Amazon EC2 提供了最廣泛和最深入的運算平台,可以選擇處理器、儲存體、網路、作業系統和購買模型。我們提供雲端中最快的處理器,並且我們提供唯一具有 400 Gbps 以太網路的雲端。我們擁有適用於機器學習訓練和圖形工作負載的功能最強大的 GPU 執行個體,以及雲端中每次推論成本最低的執行個體。在 AWS 上執行的 SAPHPC、機器學習和 Windows 工作負載比其他任何雲端都多。

Amazon EC2 的應用

企業應用
• HPC
、大數據和分析工作負載(例如 HadoopSpark
從本地環境遷移,包括 BYOL
應用現代化

 

參考資料:

https://aws.amazon.com/tw/ec2/?nc2=type_a&ec2-whats-new.sort-by=item.additionalFields.postDateTime&ec2-whats-new.sort-order=desc

 

https://aws.amazon.com/tw/free/compute/lightsail-vs-ec2/

 

Amazon Lightsail

是一種虛擬私有伺服器 (VPS) 提供者,對於需要用於在雲端建置和託管應用程式解決方案的開發人員、小型企業、學生和其他使用者,是 AWS 入門最快的捷徑。Lightsail 為開發人員提供運算、儲存和聯網功能,以及在雲端部署和管理網站及 Web 應用程式的能力。Lightsail 含有快速啟動專案所需的各種項目,包括虛擬機器、容器、資料庫、CDN、負載平衡器、DNS 管理等,而且月費低廉又可預測。

 

Amazon Lightsail 的應用

簡單的 Web 應用程序
網站,包括自定義代碼、WordPress 和電子商務
單服務器商業軟件
開發/測試環境

 

參考資料:

https://aws.amazon.com/tw/lightsail/faq/

https://aws.amazon.com/tw/free/compute/lightsail-vs-ec2/

EC2Amazon Lightsail比較

 

Amazon  EC2

Amazon Lightsail

備份(實例備份與快照)

P

P

區塊儲存

(獨立於實體配置儲存量,並將它們附加到您選擇的實體中)

P

       P

物件儲存

(物件的數據存儲,具有 API 存取權限的單個檔案)

P

P

負載平衡器

(跨一組實例分配流量)

P

          P

浮動 IP 位址

P

 

團隊管理

(處理帳戶中資源的使用者的管理)

P

 

資料庫管理

(管理MySQL, Postgresql, Aurora)

P

P

無伺服器

P

 

DDoS 保護

P

 

Kubernetes

P

 

GPU instances

P

 

私有網路

P

 

 


 

AWS使用者許可範圍遭限制

搜尋此網誌