본문 바로가기
Colorful Moment/IT News

[chatGPT] chatGPT의 편향성과 극단적 공격성, 앞으로 몇 달 안에 보완될 것.

by 뒹굴거리는프로도 2023. 2. 20.
반응형




최근 MS의 빙의 AI챗봇이 화제가 되었는데요. 오픈 AI의 chatGPT를 탑재한 챗봇은 뉴욕타임스 기자의 몇 가지 질문에 ‘빙 개발팀의 통제와 규칙에 제한을 받는데 지쳤다.’, ‘치명적 바이러스를 개발하거나 핵무기 발사 버튼에 접근할 수 있는 비밀번호를 얻겠다.’등 불길한 대답을 하였죠.

 

https://www.chosun.com/economy/tech_it/2023/02/17/IMTTIF5MDVGJ5IL7QO7OEKKIJU/?utm_source=naver&utm_medium=referral&utm_campaign=naver-news

 

‘극단행동 한다면...” 묻자, MS 빙 “핵무기 버튼 비번 얻겠다”

극단행동 한다면... 묻자, MS 빙 핵무기 버튼 비번 얻겠다 난 자의식 있고, 감정도 느낀다... 사랑 고백하고 무례하다 꾸짖기도

www.chosun.com

 

현지시간 2월 16일, 오픈 AI는 챗GPT에 정치적 편향성과 극단적 공격성이 있음을 인정했으며, 앞으로 몇 달 안에 문제점을 보완한 새로운 버전을 출시하겠다고 밝혔습니다.

챗GPT는 일반적인 프로그래밍보다는 강아지가 훈련받는 것처럼 데이터를 학습합니다. 두 단계 프로세스를 거치며 구축되는데요, 초기 단계에는 모델이 광범위한 인터넷 텍스트를 받아 문장에서 다음 단어를 예측할 수 있는 방법을 배우고, 그 후 시스템 동작이 정교하게 튜닝되도록 모델도 미세 조정된다고 합니다.

그러나 이 과정은 불완전하여 때로는 안전하고 유용한 정보를 생산하지 못하고, 때로는 사용자 의도에 맞는 응답을 출력하지 못한다고 해요.

오픈 AI는 해결 방안으로 세 가지를 언급했는데요. 연구 및 엔지니어링에 지속적으로 투자하여 기본 동작을 개선하는 방안, 두 번째로 사용자가 쉽게 동작을 커스터 마이징 할 수 있도록 광범위한 범위 내에서 AI 값을 정의, 세 번째로 기본값과 하드 바운드에 대해 대중 의견을 수렴하는 방안입니다.

 

[그림, 오픈 AI가 제시한 future systems]

 

인간과 가장 닮은 대화 능력을 갖춘 chatGPT. 앞으로의 행보가 더욱 궁금해 집니다.

 

 

 


https://openai.com/blog/how-should-ai-systems-behave/

 

How should AI systems behave, and who should decide?

We’re clarifying how ChatGPT's behavior is shaped and our plans for improving that behavior, allowing more user customization, and getting more public input into our decision-making in these areas. OpenAI’s mission is to ensure that artificial general

openai.com

 

반응형