생성형 AI는 검색엔진의 꿈을 꾸는가?
생성형 AI는 검색엔진의 꿈을 꾸는가?
"이런 상황이 독점 기업들에게 지금과 같은 엄청난 권력을 주었습니다. 그들은 서버 수백만 대를 운영하는데 우리가 움직일 수 있는 건 사실상 엄지손가락뿐이니까요. 너무 비대칭적인 상황입니다. 이런 정보의 비대칭성을 해결하지 않는 한, 계속해서 누군가는 어마어마하게 큰 독점 기업을 만들 기회를 잡을 것이고, 또 누군가는 그 사업에 자금을 지원할 것입니다."
—제임스 볼, 이가영 옮김, <21세기 권력> (다른, 2021)
AI 윤리 뉴스 브리프
2024년 8월 넷째 주
by 🧙♂️텍스
목차
1. 생성형 AI의 문제를 우회하기 위한 전략: 검색엔진
2. 프라이버시 샌드박스 적용을 또 다시 유예한 구글
3. 퍼플렉시티의 표절 논쟁과 수익 분배 프로그램 시작
1. 생성형 AI의 문제를 우회하기 위한 전략: 검색엔진
2. 프라이버시 샌드박스 적용을 또 다시 유예한 구글
3. 퍼플렉시티의 표절 논쟁과 수익 분배 프로그램 시작
1. 생성형 AI의 문제를 우회하기 위한 전략: 검색엔진
- 오픈AI는 2024년 7월 25일, SearchGPT의 프로토타입을 공개했습니다. 이는 향후 출시될 서비스의 티저로, 페이지에는 사용자들이 먼저 서비스를 체험할 수 있는 웨이팅 리스트가 포함되어 있었습니다. 특히, 해당 페이지에는 "사이트가 생성형 AI 학습에서 제외되더라도 검색 결과에 나타날 수 있습니다."라는 매우 흥미로운 문구가 눈에 띄었습니다.
- 오픈AI가 이미 존재하는 검색엔진 시장에 뛰어드는 선택을 통해 현 생성형 AI의 저작권 문제를 우회하고 새로운 수익원을 확보하는 전략을 추구하는 것이란 판단이 듭니다. 이 경우에는 생성형 AI의 불확실성을 피하고 이미 확립된 검색엔진의 크롤러 및 데이터 거버넌스를 채택할 수 있기 때문입니다.
- 구글의 반독점법 위반 판결과 함께 새로운 플레이어의 등장으로 오랜 기간 구글이 독점해 온 검색엔진 시장에도 변화가 있을지 앞으로 지켜봐야 할 것으로 보입니다.
2. 프라이버시 샌드박스 적용을 또 다시 유예한 구글
- 2024년 7월 22일, 구글은 프라이버시 샌드박스를 통해 제3자 쿠키를 완전히 대체하겠다는 기존 계획을 수정하여 여전히 옵션으로 남기는 결정을 하였습니다. 구글은 그 근거로 프라이버시 샌드박스의 실험 결과에서 제3자 쿠키를 사용하는 현재 시스템에 비해 프라이버시 샌드박스가 추천 정확도가 떨어져 광고 수익이 20% 감소할 수 있다는 점을 지적했습니다. 프랑스 온라인 광고 업체인 크라이오는 퍼블리셔들이 60%까지 광고 수익의 하락이 있을 수 있다고도 주장합니다.
- 프라이버시 샌드박스는 온라인상 이용자를 직/간접적으로 개인정보에 접근하지 않으면서도 현재의 온라인 광고 시장을 유지하려는 프로젝트입니다. 이 이니셔티브는 온라인 광고에서 사용자의 검색기록을 담고 있는 제3자쿠키를 완벽히 대체하는 프레임워크를 도입하는 것을 목표로 2020년 1월에 시작했습니다. 특히 웹브라우저(크롬) 및 모바일(안드로이드)에서 점유율 1등을 차지하고 있는 구글은 현 온라인 광고 시스템을 유지하면서도 규제당국 양쪽을 만족시키기 위한 방안으로 이를 시작했습니다.
- 온라인 광고는 개인정보 침해와 같은 부정적인 측면을 담고 있는 동시에 이용자에게 무료 인터넷 서비스를 제공할 수 있는 원천이라는 점에서 프라이버시 침해 정도에 대한 줄다리기가 여전히 이어지고 있습니다. 이와 관련된 이해당사자들 간의 논의에서 막상 프라이버시의 원천인 사용자는 배제된 현 상황에서 개인정보 보호를 위한 진전은 어려울 것으로 보입니다.
3. 퍼플렉시티의 표절 논쟁과 수익 분배 프로그램 시작
- 최근 퍼플렉시티(Perplexity.ai)는 와이어드 및 포브스의 유료 콘텐츠 무단 수집하여 사용하는 것으로 추정되고, 이 때문에 자사 챗봇의 응답이 콘텐츠를 표절(Plagiarism)한다는 비판을 받았습니다. 만약 퍼플렉시티가 생성 답변의 출처에 대한 인용을 명확히 했다면, 이는 표절이 아니라 저작권 침해의 논리로 언급이 되었을 것입니다.
- 챗GPT 이전 검색엔진은 사용자의 질문과 관련이 큰 창작자의 웹페이지로 연결해 줍니다. 하지만 생성형 AI의 시대에는 검색엔진 없이도 질문에 해당하는 답을 생성합니다. 검색엔진 시대의 콘텐츠와 창작자와 간의 긴밀했던 관계는 생성형 AI 시대에서는 멀어졌습니다. 그리고 학습 데이터와 생성형 AI와의 새로운 관계를 조율할 필요가 생겼습니다.
- 퍼플렉시티는 표절 이슈에 대한 해법으로 수익 분배 (revenue sharing) 등을 포함한 퍼블리셔 프로그램을 시작한다고 공지했습니다. 사용자가 질문하고 퍼플렉시티가 해당 질문에 대한 답변에서 특정 퍼블리셔의 기사를 인용하여 광고 수익을 창출할 때마다, 그 수익의 일정 비율을 공유한다고 합니다. 퍼플렉시티의 수익 분배가 생성형 AI 및 온라인 광고 시장에서 창작자를 고려한 흐름으로 갈 수 있는지 계속 지켜봐야 할 것 같습니다.
🦜
#feedback
오늘 이야기 어떠셨나요?
여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.
남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.