簡介密碼學

作者 included in 收錄於 IT鐵人賽 and series

2019-09-23 2019-09-23 約 137 字預計閱讀 1 分鐘

密碼學基礎為數學與電腦科學，雖然有分為古典密碼學與現代密碼學兩種，因 web 身分驗證都跟現代密碼學息息相關，所以本主題提到的密碼學都是指現代密碼學。密碼學旨在討論資訊保密、資訊完整性、不可否認性以及資訊安全問題等。而除了身分驗證以外，這些特性也是其他某些技術的基礎，如區塊鏈。

以下會簡單介紹與密碼學相關的術語。

加密與解密、明文與密文

加密（encrypt）與解密（decrypt）是互為相反的操作，加密是將明文（plaintext）轉變成密文（cipher）的過程；解密則是將密文轉變成明文的過程。以時序圖來看如下：

sequenceDiagram
    Alice->>Encrypter: Plaintext
    Encrypter->>Decrypter: Cipher via internet
    Decrypter->>Bob: Plaintext

以上例來看，密文放上網路上之後，是沒人看得懂的。只有擁有解密器的 Bob 才能將此密文解回明文。

Kerckhoffs’s principle

上述的加密解密流程是非常理想的。舉個例子，只要演算法流出的話（如電腦被偷），那任何人都能當攻擊者攻擊兩邊的系統。

這位 Kerckhoffs 在 19 世紀的時候提出一系列的設計加密系統的原則，而關鍵在於他提到了：即使演算法完全洩漏，只要金鑰沒有洩漏，密文就仍然是安全的，如 JWT 在 header 上就有明白跟大家說它是用什麼樣的演算法。當然這並不是說要叫大家公開演算法，而是說要確保公開了也不會有安全上的問題。

雜湊

密碼學裡的雜湊（hash），具備以下理想的特性：

Avalanche effect，指輸入發生微小的改變，輸出會有很大的改變
Preimage resistance，指依靠輸出的結果，是求不到輸入值的，也就是俗稱的不可逆
Second-preimage resistance，給定字串 X，很難找到另一個字串 Y 讓 hash(X) = hash(Y)
Collision resistance，無法計算出兩個字串 X 與 Y 讓 hash(X) = hash(Y)

這些特性讓雜湊在身分驗證上有非常多種應用，最常聽到的就是作為保存密碼的方法，這樣即便雜湊外流了，理想上是無法從雜湊回推密碼。

MAC

Message authentication code，簡稱 MAC。它可以用特定演算法，從原本的資料來產生一小段資訊，只要原本的資料被偷改的話，產生的資訊就會不同，因此可以驗證資料完整性，從 Wiki 的範例圖可以非常清楚了解它的運作流程。

來源：Wiki

圖裡有兩個角色為 Sender 與 Receiver，整個流程要完整走完的條件是，兩個角色需要有共同的 Key(K)。若 Key 只有你知我知的話，那就能使用 MAC 來確保訊息是由你傳給我，或是我傳給你的，因為那一小段的資訊只能靠擁有 Key 的人產生。這稱之為「可驗證性（authentication）」

數位簽章

簽合約通常能證明這份合約我已經讀過且認可了。而在上法院時，當時不在現場的法官看到有簽名，就會認為我已經看過合約。

數位簽章（digital signature）也是類似的概念，擁有私鑰（private key）可以對一個資料做簽章，擁有公鑰（public key）則能驗證簽章。若成功驗證簽章，代表此資料是完整的，且同時也能確認此資料是由擁有私鑰的人產生的。簽章的流程大致如下：

sequenceDiagram
    Alice->>Signer: Private key + hash(data) = sign
    Signer->>Bob: data & sign via Internet
    Bob->>Verifier: hash(data) & sign
    Note right of Verifier: Using Alice public key to verify

因為只有私鑰能簽章，而在使用上，私鑰通常都是保護的好好的，而公鑰通常是公開散布出去的，因此只要在路邊撿到一組 data + sign，然後隨便拿了 Alice 的公鑰一驗，居然通過了！那在理想上，我們可以確認這個 data 是 Alice 產生的。這稱之為「不可否認性（non-repudiation）」。

亂數

正如其名，亂數的目的是要產生隨機數，因此基本條件是要夠亂沒有規律，但在極大量樣本數的前提下，所有數字都要分布平均，也就是指「隨機性」。

有的亂數產生器是有辦法預測的，比方說以時間為亂數種子（seed）的亂數，產出來的亂數就是會著時間變化，這有可能會讓攻擊者趁虛而入，如在提 Cookie 的安全隱患時，有提到隨機產生 Session Prediction，這就是一種可能的攻擊手法。因此對做身分驗證來說，亂數是需要「不可預測性」的。

另外亂數產生時，有時候會產生出重複的數列，而有的演算法則不會，這個則是「不可重複性」。

而對身分驗證來說，「不可預測性」或「不可重複性」才是相較安全且必要的特性。

小結

密碼學並不擅長，但今天還是把看到與知道的東西整理成一篇文章了，跪求高手指教！

參考資料

密碼學 - 維基百科
Message authentication code - 維基百科
數位簽章 - 維基百科
應用密碼學入門 - Allen Chou

目錄

目錄

簡介密碼學

加密與解密、明文與密文

Kerckhoffs’s principle

雜湊

MAC

數位簽章

亂數

小結

參考資料