AI가 흥하면 모두 잘 살게 되나요?
EU AI법, 국가주의, 학습데이터가 곤란한 사정
이렇게 질문해야 한다. 즉 무엇을 무시할 수 있는가? — "무시할 수 있는 것은 무시해야 하기" 때문이다.
—육 후이, <디지털적 대상의 존재에 대하여> (새물결, 2021), 96
AI 윤리 뉴스 브리프
2024년 3월 셋째 주
by. 🤖아침
목차
1. EU AI법, ‘글로벌 표준’과 국경의 문제
2. AI에 세금을 투입하면 돈값을 할까?
3. 오픈AI를 곤란하게 하는 학습데이터
1. EU AI법, ‘글로벌 표준’과 국경의 문제
- 유럽의회에서 인공지능법안(AI Act, EU AI법)이 4년여의 여정 끝에 가결되었습니다. 해당 법안은 올해부터 단계적으로 도입되어 2026년 전면 시행 예정입니다. EU AI법의 골자는 '위험 기반 접근'으로, AI 시스템 위험도를 4등급으로 나누어 허용하거나 금지할 대상/범위를 지정하는 것입니다. (작년에 뉴스레터에서 요약정리한 내용을 참고해주세요)
- EU 측은 이번 법안 통과를 업계 로비에 대한 민주주의 절차의 승리라고 자평하는데요. 시민사회에서는 AI 업계의 입김으로 예외 조항이 과해졌다고 보는 시각도 있습니다. 유럽 시민단체 연합 '감시 말고 보호하라' (#ProtectNotSurveil)는 특히 이민 관련 예외조항을 강력하게 비판합니다. 다른 영역에서 허용되지 않는 기술(위험 예측, 감정 인식 등)이 출입국 맥락에서 허용됨에 따라 취약한 이민자 및 소수인종에 대한 인권침해 소지가 있고, 치안/안보 관련 기술에 투명성 의무 예외가 적용되어 공권력의 기술 남용에 대한 견제나 이의제기가 사실상 불가능하다는 것입니다. 유럽에서 금지된 기술을 EU 밖(예컨대 중국이나 이스라엘)으로 수출하는 행위를 막는 조항이 없다는 점도 비판 대상입니다.
- 이번 법안 통과로 AI 규제에 관한 글로벌 표준을 제시했다는 유럽. 하지만 '글로벌 표준'도 당신이 누구인지, 어디에서 왔는지에 따라 다르게 적용되는 셈입니다.
더 읽어보기
- 정보인권연구소의 EU AI법 합의안 분석
2. AI에 세금을 투입하면 돈값을 할까?
- 미국 AI Now 연구소에서 미국, 유럽, 인도, 남아공, UAE 등 각국의 AI 산업 정책에 관한 비평적 에세이를 모은 자료집 <AI 국가주의(들)>을 발간했습니다. 현재 추진되는 정책들은 '민주화'라는 미명 아래 실제로는 사기업 권력을 강화한다는 경고와 함께, 묵직한 질문을 여럿 던집니다. 수많은 영역에서 정부 지출이 축소되는 추세에도 불구하고 각국의 AI 관련 지출만큼은 활발한데요. 과연 그러한 지출의 기회비용은 얼마나 정당화될 수 있냐는 것입니다.
- 공교육에 AI를 도입하는 것이, 무상급식이나 보육 예산을 늘리는 것보다 학생들에게 도움이 될까요? AI 기반 기후 모델링이 가져오는 개선효과가, 모델 구축에 소모되는 에너지, 냉각수와 그로 인한 기후위기 악화보다 클까요? 의료 AI 투자 대비 간호/간병 투자는요? AI 산업에 막대한 공공자금이 투입되지만 정작 시민의 의견을 반영하는 절차는 드물고, 전문가 역할을 하는 것은 대개 정부와 AI 업계 종사자입니다.
- 보고서는 "더더욱 큰 규모의 AI가 그 자체로 공익적이라는 명제를 마치 당연한 것처럼 받아들이는 대신, AI로 인한 이익과 피해가 각각 누구에게 몰리는지 명확히 이해해야 한다"고 주장합니다. 국내에서도 유통되는 [AI 주권 = 거대 모델 = 국익]이라는 내러티브를 염두에 두고 읽어볼 만해 보입니다.
3. 오픈AI를 곤란하게 하는 학습데이터
생성 AI 서비스에 있어서 중요한 쟁점이자 아직 법적 회색지대로 남아있는 영역, 학습데이터인데요. 지난주에 흥미롭게 본 두 가지 소식을 공유합니다. 둘 다 오픈AI가 등장합니다.
- 💭 오픈AI는 최근 동영상 생성 모델 '소라' 데모를 공개하여 이목을 끌었습니다. 지난 13일에는 CTO 미라 무라티가 월스트리트저널과 인터뷰를 하며 올해 제품이 출시될 것이라고 알렸는데요. 이 인터뷰가 영미권 SNS에서 큰 반향을 일으켰는데, 긍정적인 방향만은 아니었습니다. 학습데이터에 유튜브나 인스타그램, 페이스북 동영상이 포함됐냐는 기자의 질문에 무라티는 머뭇거리며 "모른다"고 답했고, 이 장면이 바이럴하게 퍼진 것입니다.
- 현재 가장 유명한 AI 기업 CTO의 입에서, 차기 간판 서비스의 제작 방식을 '모른다'는 발언이 나오는 건 특이합니다. 정말 몰랐을 수도 있지만, 법적으로 곤란한 상황을 피하기 위한 거짓말이라고 보는 쪽이 조금 더 설득력 있게 느껴집니다.
- 💭 뉴욕타임스발 소송에 대한 오픈AI 입장문, 기억하시나요. 이번엔 뉴욕타임스가 오픈AI 측의 기각 주장을 반박하는 의견문을 제출했습니다. 목차부터 매운맛인데, 첫 두 절의 제목이 각각 "뉴욕타임스의 입지와 사업모델은 세계 최고 수준의 저널리즘에 기반함"과 "오픈AI의 입지와 사업모델은 대규모 저작권 침해에 기반함"입니다. 언론사가 쌓아온 백년 어치의 저작물을 유용하여 무료로 제공함으로써 막대한 손해를 끼쳤다는 것입니다.
- 한편 여러 LLM에 책 내용을 인용하라는 지시를 내린 실험 결과 GPT-4가 유독 저작권법상 보호받는 원문을 잘 재현했다는 연구를 공개한 스타트업도 있습니다. 재판의 귀추는 두고 봐야겠지만, AI 업계에 학습데이터 문제가 계속 중요하게 작용할 것을 예상할 수 있습니다. 앞으로 시행될 EU 인공지능법안에서도 생성 AI 모델 개발업체에게 투명성 차원에서 학습데이터 개요 제공을 의무적으로 요구합니다.
- 생성 AI 업계의 데이터 활용 방식에 관한 문제제기가 현재처럼 공론화되고 있는 데에는 대형 콘텐츠 플랫폼이나 언론사뿐만 아니라 각종 분야의 창작자와 이들에 연대하는 활동가, 관련 연구자의 노력이 모인 결과이기도 합니다. 전자처럼 지식재산권을 법적으로 보호할 자원이 충분하지 않은 창작자들은 과연, 그리고 어떻게 대응할 수 있을지 궁금해지는 대목입니다.
더 읽어보기
- AI가 당신의 글을 좋은 데 쓸 거예요. (2024-01-31)
- 생성 AI와 저작권, 정산은 본질이 아니다 (2023-07-10)
🦜캘린더
- 📅 Shifting the Frame: The Labors of ImageNet and AI Data
USC Center for AI in Society, 2024-03-19 - 📅 Virtual Summit On Deepfake Abuse
ANOTHER BODY, 2024-03-19 ~ 03-20 - 📅 GISTeR 포럼: AI와 다양성
한국과학기술젠더혁신센터, 2024-03-20
#feedback
오늘 이야기 어떠셨나요?
여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.
남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.