본 문서는 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 보고 제 주관대로 정리한 글입니다.


HyperText Transfer Protocol

모든 것이 HTTP

  • HTML 문서나 텍스트뿐만 아니라 이미지, 음성, 영상 등의 파일, API에 주로 쓰이는 JSON, XML까지 거의 모든 형태의 데이터 전송이 가능
  • 서버 간에 데이터를 주고 받을 때도 대부분 HTTP를 사용

HTTP 역사

  • HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더 X
  • HTTP/1.0 1996년: 메서드, 헤더 추가
  • HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
    • RFC2068 (1997) -> RFC2616 (1999) -> RFC7230~7235 (2014)
  • HTTP/2 2015년: 성능 개선
  • HTTP/3 진행 중: TCP 대신에 UDP 사용, 성능 개선

기반 프로토콜

  • TCP: HTTP/1.1, HTTP/2
  • UDP: HTTP/3
  • 2022년 2월 기준, 네이버 웨일 브라우저로 몇몇 사이트를 확인해본 바, 대부분 HTTP/2를 주로 사용했으며, 유튜브의 경우 HTTP/3을 주로 사용했다.

HTTP 특징

  • 클라이언트 서버 구조
  • 무상태 프로토콜(Stateless), 비연결성
  • 단순하고, 확장 가능하다.

클라이언트 서버 구조

  • 클라이언트가 먼저 요청을 보내면, 그에 맞게 서버가 응답을 하는 구조다.
  • 클라이언트와 서버를 분리함으로써 각각 독립적으로 진화할 수 있다는 장점이 있다.

무상태(Stateless) 프로토콜

  • 서버가 클라이언트의 상태를 보존하지 않는다.
  • 장점: 스케일 아웃이 쉽다.
  • 단점: 클라이언트가 추가 데이터를 전송해야 한다.

상태 유지(Stateful)

  • 어떤 가게에서 물건을 구매한다고 했을 때, 점원이 고객의 정보를 기억하고 있기 때문에 한 번 말했던 것은 계속 말할 필요가 없다.
  • 중간에 점원이 바뀌면 안 된다.
    • 바뀐다면 고객에 대한 정보를 다른 점원에서 모두 알려줘야 한다.

무상태(Stateless)

  • 어떤 가게에서 물건을 구매한다고 했을 때, 점원은 고객의 정보를 기억하지 않기 때문에 고객이 자신의 정보를 지속적으로 점원에게 말해줘야 한다.
  • 중간에 점원이 바뀌어도 된다.
  • 응답 서버를 쉽게 바꿀 수 있기 때문에 스케일 아웃에 유리하다.

실무에서 무상태(Stateless)의 한계

  • 모든 것을 무상태로 설계하기엔 어려움이 있다.
    • E.g., 로그인
    • 로그인한 사용자의 경우, 로그인했다는 상태를 서버에 유지
    • 일반적으로 브라우저 쿠키와 서버 세션 등을 사용
  • 상태 유지는 필요한 부분에만 최소한으로 사용하는 것이 좋다.

비연결성(Connectionless)

연결을 유지하는 모델

  • 서버 한 대와 클라이언트 1, 2, 3이 있을 때, 이전에 클라이언트 1의 요청이 있었다면, 이후에 클라이언트 3과 통신할 때도 클라이언트 1과의 연결을 유지한다.

연결을 유지하지 않는 모델

  • 서버 한 대와 클라이언트 1, 2, 3이 있을 때, 클라이언트 1의 요청에 대한 응답이 끝나면 바로 연결을 끊기 때문에 다른 클라이언트와 통신할 때는 클라이언트 1과의 연결 상태를 유지하지 않는다.

비연결성 특징

  • HTTP는 기본적으로 연결을 유지하지 않는 모델
  • 일반적으로 초 단위 이하의 빠른 속도로 응답
  • 서버 자원을 매우 효율적으로 사용 가능

비연결성 한계와 극복

  • 매번 TCP/IP 연결(e.g. 3 Way Handshake)을 새로 맺어야 하기 때문에 오버헤드가 증가한다.
  • 웹 브라우저로 사이트를 요청할 때, HTML 뿐만 아니라 JS, CSS, 이미지 등 여러 리소스를 다운로드하는데 매번 새로 연결하면 매우 비효율적이다.
  • 현재는 HTTP 지속 연결(Persistent Connections)로 문제를 해결했으며, HTTP/2와 HTTP/3에서 더욱 최적화됐다.

HTTP 지속 연결(Persistent Connections)

  • 클라이언트와 서버가 연결을 할 때 1초, 데이터를 주고받을 때 1초, 연결을 종료할 때 1초가 걸린다고 가정한다.
  • 지속 연결을 하지 않을 시, 3개의 데이터를 주고받는다면 각각 연결과 종료를 하기 때문에 3초씩 총 9초가 걸린다.
  • 지속 연결을 하면, 주고받을 데이터가 있는 동안은 연결을 유지하기 때문에 연결 1초, 3개의 데이터 3초, 종료 1초, 총 5초가 걸린다.

HTTP 메시지

HTTP-message  = start-line
                *( header-filed CRLF )
                CRLF
                [ message- body ]

공식 스펙

시작 라인

요청

GET /search?q=hello&hl=ko HTTP/1.1
  • request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
  • HTTP 메서드: 서버가 수행해야 할 동작 - Get
  • 요청 대상: 일반적으로 "/"로 시작하는 절대 경로 - /search?q=hello&hl=ko
  • HTTP Version - HTTP/1.1

응답

HTTP/1.1 200 OK
  • status-line = HTTP-version SP status-code SP reason-phrase CRLF
  • HTTP Version - HTTP/1.1
  • 상태 코드: 요청 성공, 실패를 나타냄 - 200
  • 이유 문구: 사람이 이해할 수 있는 짧은 상태 코드나 설명 - OK

HTTP 헤더

요청 메시지

Host: www.google.com

응답 메시지

Content-Type: text/html;charset=UTF-8
Content-Length: 3423
  • header-field = field-name ":" OWS(띄어쓰기 허용) field-value OWS
  • field-name은 대소문자 구분 없음
  • HTTP 전송에 필요한 모든 메타 데이터

HTTP 메시지 바디

<html>
  <body>
    ...
  </body>
</html>
  • 실제 전송할 데이터
  • HTML, 텍스트, 이미지, 영상, JSON 등 바이트로 표현할 수 있는 모든 데이터 전송 가능
복사했습니다!