윤석열 정부, <디지털 권리장전>

몇 가지 의문점을 여러분과 나누고 싶습니다

윤석열 정부, <디지털 권리장전>

그러나 변해야 하는 쪽은 빌어먹을 컴퓨터가 아니라 우리 인간이다. 우리의 미래는 우리 자신의 땀과 노력을 통해 기적처럼 만들어가야 한다.

—커트 보니것, <나라 없는 사람>, p. 62.
목차
1. 윤석열 정부의 ‘디지털 권리장전’ 미리보기
2. 이미지넷을 비판적으로 읽는 법

💌 AI 윤리 레터가 오래 유지될 수 있도록 응원하러 가기
📆
소식
- 심포지움: 생성형 인공지능의 윤리적·법적·사회적 쟁점들 (홍성욱, 조은서, 최문실)
서울대 AI연구원 인공지능 ELSI 연구센터(2003-09-14)
- 세미나: 비판적 인공지능 읽기
캣츠랩, 2023-09-21 ~ 2023-12-14
- Understanding LLMs and Breaking Down the AI Hype (Alex Hanna, Emily M. Bender, Luiza Jarovsky)
The Privacy Whisperer, 2023-09-22 (한국시간 기준)

윤석열 정부의 ‘디지털 권리장전’ 미리보기

by 🤔어쪈

지난 몇 년간 우리는 현시대에 다양한 이름을 붙여왔습니다. 한창 지능정보사회시대라고 부르다가 언제부터인가 4차 산업혁명이라는 용어가 더 많이 쓰이기 시작했죠. 그렇다면 지금은요? 정부에 따르면 오늘날 우리는 ‘디지털 심화 시대’에 살고 있습니다. 디지털 기술이 사람을 보조(디지털화), 보완(디지털전환)하는 것을 넘어 대체공존하는 것이 특징이라고 하네요.

과학기술정보통신부는 디지털 심화 시대를 맞아 ‘디지털 신질서’ 정립을 위한 공론화에 한창입니다. 이번 달 (가칭)<디지털 권리장전>(이하 권리장전)발표를 앞두고 각종 간담회를 개최하고 있는데요. 약 한 달 사이에 거의 10차례에 달하는 자리를 만들며 막바지 정당성 확보의견 수렴 중입니다. 뉴욕, 다보스, 파리 등에서 대통령이 직접 언급하며 발표를 예고한 사항인 만큼 조만간 결과를 받아볼 수 있을 거예요.

최근 새로 생긴 ‘디지털 공론장’ 웹사이트를 통해 누구나 디지털 권리장전을 읽고 의견을 개진할 수 있습니다. 아직 전문 초안이 공개되지 않은 만큼 권리장전의 세부 내용을 구체적으로 다루진 않으려고 하는데요. 다만 의문점 몇 가지를 구독자 여러분과 공유하고 의견을 나누고 싶습니다.

첫째, 지금 우리에게 필요한 게 새로운 디지털 질서를 포괄적으로 적은 헌장일까요? 앞서 언급한 것처럼 새로 들어선 정권은 늘 현재를 ‘전례 없는 시대’로 규정하며 비슷한 작업을 추진해 왔습니다. <지능정보사회 윤리헌장 및 가이드라인>이 있고, <국가 인공지능 윤리기준>도 만들었죠. 스케일이 커지긴 했지만 담고 있는 내용은 크게 바뀌지 않은 채, 또 구체적인 실천 방안이나 개별 쟁점에 대한 논의와 갈등 해소는 피한 채, 또 다른 추상적인 선언만 되풀이하는 건 아닌가 하는 생각이 듭니다.

둘째, 권리장전의 방향성부터 구체적인 내용까지 납득하기 힘든 이분법적 사고방식이 눈에 띕니다. 정부는 전문가와 일반 시민을 대상으로 한 설문을 통해 권리장전이 지향하는 사회상으로 ‘디지털공동번영사회’를 꼽았습니다. 혁신을 지향하고 혜택을 공유하는 사회죠.

하지만 혁신의 반대편에 안전이 있는 것은 의아합니다. 혁신을 택하면 안전을 버려야 하는 걸까요? 그뿐만 아니라 5가지 기본원칙 아래 논의 중인 세부 주제에서도 양자택일을 유도합니다. 맥락이나 조건에 대한 부연 없이 표현의 자유와 책임 있는 행사 중 무엇을 더 강조해야 하는지, 개인정보를 보호해야 하는지 활용해야 하는지, 시장자율에 맡기는 게 좋을지 규제하는 것이 좋을지 등 사실상 선호도 조사를 실시하고 있죠. 이게 적절한 공론화일까요?

2030 미래 시나리오 및 전문가, 시민 설문조사 결과 ‘디지털 권리장전’이 지향하는 미래상
출처: 2030 미래 시나리오 및 전문가, 시민 설문조사 결과 ‘디지털 권리장전’이 지향하는 미래상

🦜AI 윤리 레터는 현 시대를 어떻게 부를지와 무관하게 AI와 같이 새롭고도 오랜 기간 우리와 공존해온 기술이 가져오는 실질적인 사회 문제와 고민들을 소개해 왔습니다. 구독자 여러분도 대부분의 문제가 헌장, 가이드라인, 기준 및 원칙, 권리장전과 같은 문서로 해소되기 어렵다는 사실을 이해하시리라 생각합니다. 부디 권리장전 발표 이후에는 다음 단계로 넘어갈 수 있기를 바랍니다.

이미지넷을 비판적으로 읽는 법

by 🤖아침

이미지넷은 AI 분야에서 가장 유명한 데이터셋 중 하나로, 1400만 건이 넘는 이미지가 2만 개 이상의 범주로 분류되어 있습니다. 기계학습 이미지 분류 과업에서 가장 영향력 있는 자료라고 해도 과언이 아닌데요. 이미지넷은 어떻게 만들어졌을까요?

문제1 : 초초초저임금 노동

리 페이페이는 2006년 처음 구상한 이미지넷을 통해 "사물의 세계를 모조리 기록할 작정"이라는 포부를 밝힙니다. 리는 세 가지 수단을 활용합니다. 인터넷에 어마어마한 규모로 쏟아지는 이미지 데이터, '워드넷' 데이터베이스의 의미 구조, 그리고 저임금 크라우드 노동입니다.

워드넷은 영어 단어를 신세트(synset)라는 개념 단위로 묶어 여러 범주로 분류하는데요. 이미지넷 연구진은 워드넷의 신세트 중 명사 4만 개를 골라 검색엔진으로 검색했습니다. 그렇게 검색어 하나 당 평균 평균 1만 건의 이미지를 수집했죠.

이제 분류에 적합한 이미지를 수작업으로 걸러내야 합니다. 학생을 고용하려 했으나 그러기엔 이미지가 너무 많아 인건비로 골머리를 앓던 차, 리는 아마존 메커니컬 터크를 접하게 됩니다. 그렇게 이미지넷 프로젝트는 대규모, 저임금의 크라우드 노동자들에 의해 분당 평균 50개의 이미지를 라벨링합니다.

케이트 크로퍼드는 그의 저서 <AI 지도책>에서 이미지넷의 성공에 힘입어 AI 연구에서 "데이터를 동의 없이 대량으로 추출하고 저임금 크라우드 노동자에게 라벨링을 시키는 접근 방식"이 표준 관행으로 자리잡게 되었다고 지적합니다. 더불어 그는 이러한 관행을 데이터를 석유에 비유하는 관점과 연결짓습니다. ‘데이터 = 석유(자원)’로 바라보는 관점은 데이터를 추출하고 정제하는 모든 활동을 합리화합니다. 사진을 올린 사람의 동의 없이 수집한 이미지라고 하더라도요.

사슬에 묶여 있는 죄수의 모습(Amazon Mechinal=
출처: 이미지넷 관련 슬라이드 자료 캡처. 상단 문구는 “그래서 우리가 사슬에 묶여 있는 죄수를 착취하고 있는 건가요?” L. Fei-Fei,ImageNet: crowdsourcing, benchmarking & other cool things,CMU VASC Seminar, March, 2010.

문제2: 이미지넷의 기이한 세계관

<AI 지도책>은 이어 이미지넷의 (워드넷에서 차용해온) '기이한 세계관'을 묘사합니다. '신체'에 속하는 '성인 신체' 범주 하위에는 '성인 여성 신체'와 '성인 남성 신체'가 있는 반면 '남녀한몸' 항목은 ‘신체’가 아닌 '사람→호색가→양성애자' 계층에 자리잡고 있는 등 이성애규범적인 편향을 드러내는 식입니다. 어떤 분류는 노골적으로 여성 혐오적/인종차별적/노인 차별적/장애인 차별적이고요. 이미지넷 제작자들이 2009년 '명백히 불쾌한 신세트' 일부를 제거했지만 그 후 10년 동안 이미지넷이 널리 활용되는 동안에도 여전히 혐오적인 용어는 남아 있었습니다.

사람 이미지를 업로드하면 어떻게 분류되는지 보여주는 어플리케이션 '이미지 룰렛' 이미지
출처: 이미지넷 룰렛 프로젝트 웹사이트 아카이브 캡처

그러다 2019년. 크로퍼드가 관여한 이미지넷 룰렛 프로젝트가 유명세를 탑니다. 이용자가 사람 이미지를 업로드하면 이미지넷의 '사람' 범주를 토대로 어떻게 분류되는지 보여주는 어플리케이션이었죠. 결과는 문제 투성이었고, 이미지넷 프로젝트에 이목이 쏠립니다. 그제서야 이미지넷 연구진은 대학원생이 '안전하지 않은 신세트'를 제거하도록 합니다. '사람'의 하위 범주와 그 이미지 모두 절반 이상 삭제되었고, 이미지넷은 <더 공정한 데이터 집합을 위하여>라는 논문을 발표했습니다.

마침내 리 페이페이 연구진이 데이터셋의 문제를 인식한 것은 긍정적이지만, 불쾌한 항목을 삭제하는 것이 본질적인 해결책이라고 볼 수는 없습니다. 크로퍼드는 기술적 해법이 아닌 “분류 자체에 작용하는 권력의 역학 관계”에 주목해야 한다고 주장하죠. 이미지넷을 만든 분류 행위와 이미지넷이 수행하는 분류 행위는 누구의 이익에 복무하며, 누구의 관점을 대변하고, 그로 발생하는 피해는 누가 짊어지게 될까요?덧붙이는 말* 🤖아침: 이미지넷이, 타임지가 올해 선정한 'AI 분야에서 가장 영향력 있는 100명' 리스트에 오른 리 페이페이 교수의 이익과 명성에 복무해온 것은 분명해 보입니다. 같은 리스트에 케이트 크로퍼드도 들어 있군요.


#feedback

오늘 이야기 어떠셨나요?
여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.
남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.