WebRTC (Web Real-Time Communication)

WebRTC (Web Real-Time Communication)

WebRTC(Web Real-Time Communication)에 대해 설명하는 페이지입니다.

목차

개요

이번 글에서는 WebRTC(Web Real-Time Communication)에 대해 설명하겠습니다.

WebRTC란?

WebRTC(Web Real-Time Communication)란 웹 애플리케이션과 사이트가 별도의 중간자 없이 브라우저 간에 실시간 음성, 영상 통화와 데이터 전송을 가능하게 하는 기술입니다. WebRTC를 구성하는 일련의 표준들은 플러그인이나 제 3자 소프트웨어 설치 없이 P2P(Peer-to-Peer) 통신을 지원해 중간 서버를 거치지 않고 종단 간 데이터 공유와 화상 회의를 가능하게 합니다. 이를 통해 지연 시간을 줄이고 빠른 데이터 전송이 가능합니다. WebRTC는 주로 비디오 통화, 화면 공유, 파일 전송 같은 기능에 사용됩니다.

WebRTC의 주요 기능

WebRTC의 주요 기능은 다음과 같습니다.

  • 음성 및 영상 통화

    브라우저 간 영상 통화와 음성 통화를 쉽게 구현할 수 있습니다.

  • 데이터 전송

    데이터 채널을 통해 텍스트 메세지, 파일 등 다양한 데이터를 실시간으로 주고 받을 수 있습니다.

  • 화면 공유

    원격 회의나 Presentation 같은 기능에 유용하게 활용할 수 있습니다.

이와 같은 기능을 활용하여 WebRTC는 주로 화상 회의, 라이브 스트리밍, 원격 학습 플랫폼 등에서 많이 활용됩니다.

WebRTC의 장단점

WebRTC의 장단점은 다음과 같습니다.

장점

  • 실시간 통신

    플러그인 없이 브라우저 간 실시간 통신을 가능하게 해 간편하며, 서버 비용을 줄일 수 있습니다.

  • 브라우저 기본 지원

    Chrome, Firefox, Safari 등 주요 브라우저에서 기본적으로 지원되며, 별도의 플러그인이나 소프트웨어 설치 없이 사용할 수 있습니다.

  • 높은 보안성

    WebRTC는 보안을 강화하기 위해 DTLS(Secure Datagram Transport Layer Security)SRTP(Secure Real-time Transport Protocol)를 사용하여, 전송 중인 미디어와 데이터를 암호화합니다.

  • 오픈소스 및 무료 사용

    WebRTC는 오픈소스 라이브러리로 제공되므로 무료로 사용할 수 있으며, 다양한 오픈소스 라이브러리와 예제가 많아 개발과 확장이 용이합니다.

단점

  • 네트워크 환경에 따른 품질 저하

    P2P 연결은 네트워크 상태에 따라 품질이 영향을 받으므로, 네트워크 환경이 불안정한 경우에는 음성 및 영상 품질이 떨어질 수 있습니다. 또한 다수의 사용자가 참여하는 화상 회의의 경우, 네트워크 대역폭 사용이 증가하여 연결 품질이 낮아질 수 있습니다.

  • NAT 및 방화벽 문제

    NAT(Network Address Translation)이나 방화벽 설정으로 인해 P2P 연결이 제한되는 경우, TURN 서버를 통해 중계해야 하므로 대역폭 비용이 증가할 수 있습니다. 또한 기업 네트워크나 강력한 방화벽 환경에서는 직접 연결이 어려울 수 있습니다.

  • 복잡한 개발 및 운영

    STUN 서버TURN 서버를 설정해야 하며, ICE(Interactive Connectivity Establishment) 프로토콜을 통해 연결을 설정해야 하므로, 단순한 HTTP 통신보다 복잡합니다. 또한 다자간 연결을 위해서는 SFU나 TURN 서버를 별도로 운영해야 하므로, 운영 비용과 복잡도가 증가합니다.

구성해야 하는 서버

  • STUN 서버

    STUN(Session Traversal Utilities for NAT) 서버란 클라이언트가 자신의 공인 IP 주소와 포트를 알아내기 위해 사용하는 서버입니다. 클라이언트는 STUN 서버에 요청을 보내고, 서버는 요청을 수신한 IP 주소와 포트를 클라이언트에게 알려줍니다. 이를 통해 클라이언트는 자신의 공인 IP와 포트를 알아내어 NAT 방화벽을 넘어 다른 클라이언트와 직접 P2P 연결을 시도할 수 있습니다.

    STUN 서버는 주로 NAT 방화벽 뒤에 있는 클라이언트들이 연결을 설정할 때 필요한 정보를 제공합니다. 연결을 위한 경로 정보만 제공하고, 실제 데이터는 클라이언트 간의 P2P 연결을 통해 직접 전달됩니다.

  • TURN 서버

    TURN(Traversal Using Relays around NAT) 서버란 클라이언트 간에 직접 P2P 연결이 불가능한 경우 중계 서버 역할을 하여 데이터를 전송하는 서버를 의미합니다. 클라이언트는 TURN 서버에 데이터를 보내고, 서버는 이를 상대방 클라이언트에게 전달합니다.

    TURN 서버는 NAT 방화벽이 강력하여 STUN을 통해 연결이 불가능할 때 사용됩니다. 다만 TURN 서버는 모든 데이터를 중계하기 때문에 대역폭 사용량이 높아져 서버 비용이 발생할 수 있습니다.

WebRTC의 기본 작동 원리

WebRTC는 시그널링(Signaling)을 통해 두 장치가 서로 통신할 수 있도록 Peer 간 정보를 교환합니다. 시그널링(Signaling)이란 위의 3가지 API를 통해서 데이터 교환이 이루어지며 RTCPeerConnection들이 적절하게 데이터를 교환할 있게 처리해 주는 과정을 의미합니다. 시그널링 서버(Signaling Server)는 WebRTC 표준에 포함되지 않았기 때문에 별도로 구현하거나 외부 서비스를 이용해야 합니다. 시그널링 과정이 끝나면 두 장치는 직접 P2P 연결을 통해 데이터를 주고 받게 됩니다.

WebRTC 접근 방식

WebRTC는 기본적으로 P2P 방식이므로, 각 참가자가 서로 직접 연결을 맺게 됩니다. 참가자가 많아질수록 각 연결에 대한 리소스 소모가 커지며, 특히 대역폭과 CPU에 부담이 생길 수 있습니다.

Mesh 방식

Mesh 방식는 각 참가자가 모든 다른 참가자와 직접 연결을 맺는 방식을 의미합니다. 즉, 모든 참가자가 서로 연결하는 방식이비다. 예를 들어, 6명의 참가자가 존재할 경우, 각 참가자는 5개의 연결을 맺어야 합니다.

Mesh 방식은 구현이 간단하고 서버 비용이 적게 든다는 장점이 있지만, 연결이 늘어날 수록 네트워크 및 CPU 부담이 커지기 때문에, 여러 명의 참가자가 존재하는 경우에는 성능 저하가 발생할 수 있다는 단점이 있습니다. 따라서 Mesh 방식은 비교적 소규모 그룹에 적합한 방식입니다.

SFU 방식

SFU 방식Selective Forwarding Unit 서버를 활용하는 방식입니다. 각 참가자는 자신의 미디어 스트림을 SFU 서버로 보내고, 서버는 각 참가자에게 다른 사람들의 스트림을 중계합니다. 서버는 단순히 데이터를 중계하는 역할만 하기 때문에 CPU 부담이 적고 확장성이 뛰어납니다.

SFU 방식의 경우 각 참가자는 서버와 하나의 연결만 맺으면 되므로 네트워크 사용량이 적고 대규모 그룹 채팅이 가능하다는 장점이 있습니다. 다만 SFU 서버를 설정해야 하므로 서버 비용이 발생할 수 있고 설정 복잡도가 높다는 단점이 존재합니다.

SFU 방식은 다수의 참가자가 참여하는 화상 채팅을 구현할 때 일반적으로 사용되는 방식입니다. SFU 방식을 적용하기 위해 OpenVidu, mediasoup, jitsi Meet, Twilio 등 SFU 방식을 지원하는 오픈 소스나 서비스를 사용할 수 있습니다.

SFU 방식의 작동 원리

SFU 방식의 작동 원리는 다음과 같습니다.

  1. 미디어 스트림 업로드

    각 클라이언트는 자신의 비디오/오디오 스트림을 SFU 서버에 업로드합니다.

  2. Selective Forwarding

    SFU 서버는 클라이언트에게 전달한 스트림을 선택적으로 포워딩합니다. 서버는 미디어 데이터를 재가공하지 않고 클라이언트로부터 받은 데이터를 그대로 전달하므로 CPU 부하가 적습니다.

  3. 다운로드

    각 클라이언트는 다른 사용자들의 스트림을 SFU 서버로부터 다운로드합니다. 이렇게 하면 각 클라이언트는 SFU 서버와만 연결되며, 여러 명의 사용자와 직접 연결할 필요가 없습니다.

SFU 방식의 장단점

SFU 방식의 장단점은 다음과 같습니다.

장점

  • 확장성

    각 클라이언트는 SFU 서버와 하나의 연결만 유지하므로, 여러 클라이언트를 연결할 수 있습니다. 서버 리소스가 허용하는 한 많은 사용자를 동시에 연결할 수 있습니다.

  • 낮은 클라이언트 부담

    각 클라이언트는 SFU 서버와 하나의 연결만 하면 되므로 대역폭과 CPU 사용량이 줄어듭니다.

  • 다양한 레이아웃

    서버가 각 사용자의 비디오 스트림을 별도로 처리하지 않으므로 클라이언트에서 원하는 형태로 레이아웃을 조정할 수 있습니다.

  • 적은 딜레이

    SFU 서버는 클라이언트로부터 받은 데이터를 그대로 바로 전달하므로 지연 시간이 적습니다.

단점

  • 서버 운영 비용

    SFU는 클라이언트 간에 스트림을 중계하기 때문에 서버 비용이 발생하며, 사용자가 많아지면 서버 확장이 필요할 수 있습니다.

  • Bitrate 관리 필요

    SFU 서버는 여러 비디오 스트림을 선택적으로 전달하기 때문에, 각 사용자의 네트워크 상태에 맞춰 Bitrate를 조절해야 합니다.

  • 중앙 서버 의존성

    SFU 방식은 서버가 다운되면 전체 연결이 끊어질 수 있습니다. 이를 대비해 여러 서버를 활용한 부하 분산이나 백업이 필요할 수 있습니다.

참고 자료

Comments