본문 바로가기
AI & 지식재산권 (AI & IP)

데이터 스크레이핑은 약탈인가? 흄의 관습과 공정 이용론

by 철학xIT 2026. 1. 26.

 

 

인공지능의 학습을 위해 인터넷상의 방대한 정보를 긁어모으는 '데이터 스크레이핑'은 오늘날 테크 산업의 핵심 동력입니다. 하지만 동시에 이는 원저작자들에게는 자신의 지적 노동을 무단으로 빼앗기는 '약탈'로 비치기도 합니다. 뉴욕타임스가 오픈AI를 고소한 사건은 이러한 갈등의 정점을 보여줍니다.

이 복잡한 권리 다툼을 이해하기 위해 우리는 영국의 회의론적 철학자 데이비드 흄(David Hume)의 지혜를 빌려오고자 합니다. 정의와 소유권을 '보편적 이성'이 아닌 사회적 '관습'과 '유용성'의 산물로 본 흄의 시각은 데이터 경제 시대의 새로운 질서를 제안합니다.


데이터 수집의 기술
데이터 수집의 기술

1. 흄의 정의론: 정의는 사회적 관습이다

흄은 정의와 소유권이 하늘에서 떨어진 불변의 진리가 아니라고 주장했습니다. 그는 인간이 자원의 희소성과 이기심을 극복하기 위해 '사회적으로 유용한 규칙'을 합의해온 과정이 바로 정의라고 보았습니다.

  • 관습의 힘: 오랫동안 반복되어 이익을 준 규칙이 법이 된다.
  • 공공의 유용성: 규칙이 사회 전체에 이득이 된다면 그것은 정의로운 것으로 간주된다.
  • 소유의 점진적 확립: 소유권은 고정된 것이 아니라 시대적 필요에 따라 변한다.

흄의 시각에서 데이터 스크레이핑 논쟁을 보면, 이는 기존의 '개별 저작권 보호'라는 관습과 'AI 혁신을 통한 공공의 이익'이라는 새로운 유용성이 충돌하는 현장입니다.

2. 데이터는 원자재인가, 가공품인가

데이터 스크레이핑을 옹호하는 측은 웹상의 데이터가 마치 '공기'나 '햇빛' 같은 원자재라고 주장합니다. 반면 반대측은 그것이 누군가의 정교한 '가공품'임을 강조합니다.

여기서 법적 쟁점은 '변형적 이용(Transformative Use)'에 집중됩니다. 흄의 유용성 원칙에 비추어 볼 때, AI가 데이터를 수집하여 단순히 복제하는 것이 아니라 새로운 가치(지능)를 창출한다면, 이는 공공의 유용성을 증진하는 행위로 해석될 여지가 있습니다.

"만약 특정 행위가 사회 전체의 부를 키우고 지식의 진보를 돕는다면, 과거의 관습은 새로운 합의에 자리를 내어주어야 한다."

3. 공정 이용(Fair Use)과 새로운 관습의 형성

현대 지식재산권법의 '공정 이용' 원칙은 흄이 말한 '사회적 합의'의 법적 표현입니다. 데이터 스크레이핑이 정당한 이용으로 인정받기 위해서는 다음의 관습적 기준을 통과해야 합니다.

  • 이용의 목적과 성격: 비영리적인가, 아니면 새로운 창작을 위한 교육적 목적인가?
  • 시장 영향력: 스크레이핑 행위가 원저작자의 정당한 수익 모델을 파괴하는가?
  • 데이터의 양과 실질성: 전체 데이터 중 얼마나 핵심적인 부분을 가져갔는가?

결론적으로 데이터 스크레이핑은 단순한 '약탈'이냐 '자유'냐의 이분법적 문제를 넘어섰습니다. 이는 흄이 통찰했듯, 기술 혁명이라는 거대한 변화 속에서 인류가 어떤 '새로운 관습'을 유용하다고 판단할지의 문제입니다.

변리사와 IP 전략가들은 이제 기존 판례의 고수만이 답이 아님을 인지해야 합니다. 데이터 가공자에게는 정당한 사용권을 보장하고, 저작권자에게는 기술적 보상 체계(Opt-out 등)를 마련해주는 새로운 사회적 계약을 설계하는 것이 미래 IP 관리의 핵심이 될 것입니다.


데이터 공생 모델
데이터 공생 모델
반응형