The Korean Society of Costume
[ Article ]
Journal of the Korean Society of Costume - Vol. 74, No. 1, pp.61-87
ISSN: 1229-6880 (Print) 2287-7827 (Online)
Print publication date 29 Feb 2024
Received 29 Dec 2023 Revised 28 Jan 2024 Accepted 30 Jan 2024
DOI: https://doi.org/10.7233/jksc.2024.74.1.061

HAIC를 통한 창의적 패션 이미지 생성을 위한 AI 탐구

정경희 ; 이미숙
전남대학교 의류학과 학술연구교수/생활과학연구소 연구원
전남대학교 의류학과 교수/생활과학연구소 연구원
Exploring AI for Creative Fashion Image Generation through HAIC
Kyunghee Chung ; Misuk Lee
Academic Research Professor, Dept. of Clothing and Textiles, Chonnam National University/Human Ecology Research Institute
Professor, Dept. of Clothing and Textiles, Chonnam National University/Human Ecology Research Institute

Correspondence to: Misuk Lee, e-mail: ms1347@chonnam.ac.kr

Abstract

This study attempted Human-AI Co-Creation (HAIC) for fashion image generation to investigate whether AI could provide support and inspiration regarding creative fashion design to human fashion designers, serving as a collaborative partner. As such, the generated fashion images were analyzed and the characteristics of the AI agents were examined, while the research employed both literature review and empirical study methods. The literature review focused on creativity concepts and evaluation tools, HAIC in fashion design, and text-to-image AI, emphasizing relevant literature and previous studies. In the empirical study, an analysis was conducted on the characteristics of the fashion images generated by AI agents and curated by human designers, examining both the resulting fashions and the AI characteristics. The analysis revealed that fashion images generated through HAIC exhibited diverse aesthetics depending on the AI agent, containing unpredictable elements despite using the same prompt. In addition, creativity varied depending on the prompt, but overall elaboration, novelty, and aesthetics were found to be excellent. The options provided by AI agents facilitated fast and fluent modifications and transformations of fashion designs, enabling the curation of human fashion designers and making them a critical element of human-AI interaction in the design process. On the other hand, in cases of using traditional terms, images generated by AI agents lacked a comprehensive understanding of global fashion culture as they possessed characteristics reflecting fixed stereotypes. Through the analysis, it was identified that continuous improvements are required to mitigate biases in AI agents, fostering fairness and accuracy for creative fashion images. Additionally, diverse user-based services and a well-designed governance framework are necessary to allow humans to assess and intervene in images generated by AI based on creativity and experiential knowledge.

Keywords:

co-creation, fashion, generate, human-AI

키워드:

공동창조, 패션, 생성, 인간-AI

Ⅰ. 서론

AI(artificial intelligence)는 대중이 원하는 것을 실시간으로 이해하고, 창의적인 디자인, 환경 및 몰입형 콘텐츠를 개발할 수 있는 강력한 전략(Rezwana & Maher, 2022)으로써 사회, 산업, 그리고 예술 및 디자인 등 인간 고유의 창의성을 요하는 분야에 영향을 미치고 있다. 패션 영역에서도 AI 생성에 의한 패션 디자인 사례는 점차 대중화되고 있다. 2023년 뉴욕에서는 디자이너가 옷을 만든 패션 위크가 아닌 18세에서 65세까지의 폭넓은 연령대의 일반인 참가자들이 AI로 만든 패션 이미지로 꾸민 세계 최초의 AI 패션 위크(AIFW)가 개최되었다(Yoon, 2023). 패션 위크에 참여한 사람들은 AI가 인간의 창의성을 대체해서는 안 된다고 주장하면서도 AI가 새로운 기회를 제공할 수 있으며, 창작자가 기술을 실험하고 창의적인 것을 시도할 수 있는 놀라운 도구라고 인정했다. 이 행사를 주최한 메종 메타(Masion Meta)의 창립자 시릴 푸아레(Cyril Foiret)는 “패션 위크에 참여한 디자이너의 70%가 생성형 AI 미드저니(Midjourney)를 활용했다”며 “이미지를 묘사하는 텍스트를 입력해 일관성 있으면서도 서로 다른 이미지를 만드는 것은 쉬운 일이 아니다”라고 밝혔다(DeNinno, 2023). 이러한 현상들은 인간과 AI가 패션 디자인 창작 시스템에 동등하게 참여하고 상호작용하면 창의성을 높일 수 있음을 보여 준다고 할 수 있다.

특히, 다양한 AI 시스템 중 하나인 자연어 설명을 기반으로 이미지를 생성하는 AI는 창의적 패션의 시각적 구현 측면에서 그 효율성과 효과를 두드러지게 보여주고 있다. 앞서 언급한 2023 AI 패션 위크와 같이 인간은 text-to-image AI 생성기와의 공동 창작을 통해 패션 디자이너와 비전문가의 구분 없이 상상력을 확장할 수 있는 패션 이미지를 빠르고 쉽게 생성하는 것이 가능해졌다. Text-to-image AI 생성기는 인간 디자이너가 입력하는 프롬프트에 따라 다양한 스타일과 콘텐츠로 이미지를 생성할 수 있고, 인간이 시스템을 제어하여 더 많은 변형을 반복할 수 있다. 이러한 인공적인 우연과 이를 조율하고자 하는 인간의 패션 디자인 행위는 인간 디자이너의 독창성과 AI 알고리즘에 내재된 변덕스러움 및 예측 불가능성을 결합하는 창의적인 접근 방식이라고 할 수 있다. 즉, 인간-AI의 공동창조(Human-AI Co-creation; HAIC)는 인간 패션 디자이너가 상상하지 못했던 참신하고 혁신적인 패션 디자인을 도출하도록 자극하는 등, 인간의 창작 과정에 영감을 주고 창의성을 강화하는데 기여할 수 있다(Chung & Lee, 2023).

이러한 흐름에 따라 패션 디자인과 AI를 융합하는 패션 연구가 활발히 수행되고 있다. 대표적으로 패션 스타일 추천 서비스(An, Kwon, & Park, 2019; An & Park, 2021), 패션 디자인에서의 활용 방안에 관한 연구(Lee, 2020; Lee & Lee, 2021), 패션 디자인에서의 HAIC 사례를 살펴본 연구(Chung & Lee, 2023) 등은 주로 특정 AI 디자인 도구와 패션 산업 및 디자인에서의 사례와 적용 가능성을 고찰하고 있다. 이상의 선행연구들은 HAIC를 통한 패션 디자인 생성의 사례를 결과물만을 토대로 AI 활용 가능성을 고찰하고 있다는 특징을 지니기 때문에 패션 프로세스에서 핵심적이고 창의적인 단계라고 볼 수 있는 패션 디자인에서 AI가 창의적 패션 디자인 도출에 기여할 수 있는 공동 창작 에이전트로서 역할 할 수 있는지 확인하기 위해서는 패션 이미지를 실질적으로 생성·평가해보고 교육 현장 등에서 HAIC를 통한 패션 디자인 생성을 위해 활용할 수 있는 적합한 AI 에이전트를 도출할 수 있는 연구가 수행될 필요가 있다.

이에 본 연구는 AI가 인간 패션 디자이너에게 창의적인 패션 디자인을 도출할 수 있도록 패션 이미지를 제공하고 영감을 제안하는 공동 창작 파트너가 될 수 있는지를 파악하는 것을 목표로, 디자인 이미지를 생성할 수 있는 AI 에이전트와의 HAIC를 통해 패션 이미지를 생성하고 이를 평가하는 프로젝트를 진행함으로써 HAIC를 통한 패션 디자인 생성을 위해 활용할 수 있는 적합한 AI 에이전트를 도출해보고자 한다. 연구방법은 문헌연구와 실증연구로 진행하는데, 문헌연구에서는 관련 문헌과 선행연구를 중심으로 창의성 개념 및 평가 방법, 패션 디자인 영역에서의 HAIC, text-to-image AI 모델에 대해 고찰한다. 그리고 실증 연구에서는 AI 에이전트들의 특성을 살펴보고 패션 이미지 생성을 위한 프롬프트를 도출한 다음, AI 에이전트의 생성 이미지에 대한 분석 및 창의성 평가와 인간 디자이너의 큐레이션으로 생성되는 패션 이미지를 통해 텍스트 프롬프트 이해 및 표현, 창의성, 베리에이션, 인간 큐레이션 및 HAIC 가능성 등의 특징을 분석하고자 한다. 협업 에이전트로 text-to-image AI를 채택한 것은 인간이 입력하는 프롬프트에 따라 다양한 스타일이 생성될 수 있고 이미지 합성, 시스템 제어를 통해 더 많은 변형을 반복할 수 있으며, 대중이 쉽게 접속해 디자인 협업을 시도할 수 있다(Kim & Kim, 2023)고 판단했기 때문이다.


Ⅱ. 이론적 배경

1. 창의성 개념 및 평가 척도

창의성(creativity) 용어는 라틴어 ‘creāre’와 그리스어 ‘krainein’에서 유래한 것으로, 새롭고 좋은 것을 만드는 힘을 의미한다(Song, 2018). 디자인과 창의성은 새로운 아이디어를 요구하며 창조적 사고를 통해 실제의 해결 가능성을 확산시키고, 문제 해결 능력 향상이라는 점에서 관계성을 지닌다. 따라서, ‘디자인 창의성’은 특정 문제를 해결하기 위해 새로운 아이디어를 다양하게 생각하고, 깊이 있게 표현하는 능력이라고 할 수 있다(Song, 2018). 이러한 새로운 사고를 생성해 내는 것을 창의성이라고 했던 Guilford(1950)는 ‘지능구조 모델(Structure of Intellect Model)’을 소개하며 확산적 사고를 창의성의 기본이 되는 사고 유형으로 보고, 창의성을 새롭고 신기한 것을 만드는 힘으로 정의했다(Seo & Kim, 2006). 한편, Torrance(1972)는 창의성이란 문제를 인식하고, 해결하기 위해 아이디어를 내고 가설을 세우고 검증하며, 그 결과를 전달하는 과정이라고 정의했다. 그리고 Taylor(1988)는 인지적 관점에서 창의성이 유용성과 지속력이 있는 신기한 작품을 만들어가는 과정이라고 했다(Song & Park, 2014). 이러한 연구자들의 관점을 종합하면 창의성은 새롭고 신기한 것을 만들어내기 위해 생각하고, 행동하기 위해 폭넓게 사고하는 것이라 할 수 있다. 창의성의 구성요소로 Guilford(1950)는 독창성, 민감성, 유창성, 융통성, 정교성, 재정의 및 재구성력, Torrance(1972)은 독창성, 유창성, 정교성, 추상성, 그리고 미술교육에서의 창의성을 중요한 개념으로 정착시킨 Lowenfeld(1960)는 독창성, 유창성, 감수성, 융통성, 재구성, 추상·종합·조직하는 능력으로 제시했다. 이렇듯, 창의성의 구성 요소 또한, 학자에 따라 조금씩 다른 견해를 보이지만 공통적으로 중요시하는 창의성의 구성 요소는 ‘독창성’과 ‘유창성’이라고 할 수 있다.

한편, Rhodes(1961)는 창의성을 ‘4P(person, process, product, press)’로 분류했는데, 창의적 사람, 창의적 과정, 창의적 산출물, 창의적 환경이나 장소이다. 그리고 창의적 산출물의 속성에 대해 명시적인 차원을 제시한 대표적인 척도로는 CAT와 CPSS가 있다. Amabile(1982)의 CAT는 영역 특수적 관점에서 창의성을 측정하는 방법으로 예술적 창의성을 측정하기 위한 척도로는 창의성과 기술성 2가지 요소를 구분, 창의성 요소의 하위차원으로 창의성, 기발한 재료의 사용, 참신한 생각, 노력, 형태의 다양성, 세부 묘사, 복잡성, 기술성 요소의 하위차원으로 기술적 우수함, 구성력, 깔끔함, 계획성, 구상성, 좌우대칭, 표현력 등으로 구성하고 두 요소와 관련이 없는 호감도, 심미적 매력, 전시 가능성은 ‘미적 판단’의 영역으로 별도 분리했다. CAT은 창의적 산출물을 규정하기 위한 객관적인 기준을 정하기보다는 창의적 산출물 혹은 창의적 반응의 특징에 대하여 전문성을 가진 평가자들을 선택한 후, 평가자들의 독립된 주관적 준거에 의해 창의적 산출물을 6점 리커트 척도로 평가한다. 따라서 CAT은 집단 내 산출물을 서로 비교하여 상대적인 평가가 이루어지며 이후 평가자 간의 신뢰도를 산출한 후 결과를 분석하여 집단 내합의 된 결과를 도출하게 된다(Ko & Lee, 2019). 이러한 CAT는 디자인 분야 전문가의 합의된 평가를 통해 창의성을 안정적으로 평가할 수 있는 도구로 평가된다(Jeffries, 2015). 한편, Besemer & O’Quin(1999)는 산출물의 창의성을 평가하기 위해 CPSS를 개발했는데, 창의성의 3가지 요인으로 참신성, 실용성, 정교성 및 종합성을 제시하였으며 이에 대한 9개의 하위차원으로 참신성은 독창성과 놀라움, 실용성은 가치 있음, 논리성, 유용성, 이해 가능성, 정교성은 유기적 구성, 우아함, 잘 만들어진의 하위차원을 구성하였다. 이러한 CAT와 CPSS는 창의적 산출물 평가 척도 개발 및 타당화의 기초 자료로 활용되고 있으며, 창의성 평가에서 비전문가와 전문가가 동일한 평가 결과를 나타내는 척도로 평가되고 있다(Yin, Han, Huang, Zuo, & Childs, 2021). 그리고 우리나라에서는 CAT와 CPSS의 창의성 평가 요인을 토대로 Kim & Lee(2004)은 참신성, 실용성, 정교성의 3요인 구조를 측정 규준으로서 타당함을 밝혔으며, Song(2018)은 디자인 관점에서의 창의성에서 고려되는 평가 지표는 유창성, 정교성, 독창성임을 제시하고 있다.

본 연구에서는 CAT와 CPSS의 창의성 평가 지표 및 Kim & Lee(2004)Song(2018) 연구에서 제시한 평가 지표를 토대로 패션 디자인 전문가 4인이 중복되는 평가 요인들을 유사한 영역을 하나의 용어로 통합하고 패션 이미지의 창의성 평가에 적합하다고 판단되는 4개 요인, 참신성(기발한 재료의 사용, 참신한 생각, 형태의 다양성), 기술성(기술적 우수함, 논리성, 유용성, 이해 가능성), 정교성(세부 묘사, 유기적 구성, 잘 만들어진), 심미성(호감도, 심미적 매력, 전시 가능성)을 지표로 활용하여 HAIC를 통한 패션 이미지 생성물의 창의성을 평가하고자 한다.

2. 패션 디자인에서의 인간과 AI의 공동창조 (HAIC)

창의적인 문제 제기자(creative problem-poser)는 해결해야 할 문제의 목표와 초기 기본 조건과 여러 가지 중간 과정 등에 있어 문제를 바라보고 그에 따라 다양한 접근을 시도해 보는 사람을 의미한다. 즉, 문제를 해소하기 위해서는 그에 적합한 방안을 제안하는 것이 아니라 “문제를 바라보는 방법”을 창의적으로 바꾸어 보는 것이 필요하다(Thomas & Carroll, 1979). 이에, 인간은 변화하는 요구에 적응하면서 창의적 능력을 확장하기 위해 도구를 사용해 왔다. 그리고 현재 직관과 창의성은 흥미로운 방식으로 진화되어 인간은 예술, 디자인과 같은 다양한 분야에서 컴퓨팅을 창의적으로 실험하고 있다. 특히, AI는 새로운 관점에서 창작하고 집단적 인간 잠재력을 높일 수 있는 시스템을 통해 창의성에 쉽게 접근할 수 있는 세상을 열고 있다(Pieters & Winiger, 2016).

‘패션 4.0’에서도 창의적 AI와의 협업은 더욱 가시화될 전망이다. 이러한 전망에도 AI 패션 디자이너의 실현 가능성을 두고 일부 전문가들은 창의성과 상상력을 기반으로 하는 산업에 AI를 통합하는 것에 대해 회의적이다(Haenlein & Kaplan, 2019). 이유는 패션 고용 시장에 미치는 영향 등 해결해야 할 윤리적, 법적, 철학적 문제가 있기 때문이다. 그래서 인간과 AI와의 상호 융합적 협업은 중요하다. AI는 인간 경험과 복잡한 감성이나 심리적인 변화를 이해할 수 없고(Jeong & Kim, 2018), 자율성을 지니지만 설정한 조건, 기존 데이터를 학습해 표현하기 때문에 매끄럽지 않아 어색한 부분은 인간이 제거하거나 수정하는 것이 필요하며(Na, 2022), 중요한 의사 결정, 윤리적 판단 등 인간과의 협력이 필요한 지점이 있기 때문이다. 선행연구(Jung, 2021; Lee, 2022)에서도 패션 소비자들은 AI보다 인간 디자이너에 의한 역량과 제품 품질, 독창성을 더 높게 지각한다는 점을 언급하며 HAIC를 제안했듯이, 경험에서 비롯된 인간 감정과 직관, 윤리적 판단, 그리고 AI와의 융합적 협업은 더 나은 결과와 예상치 못한 가능성, 성취로 이어질 수 있다.

HAIC는 독립형 생성 시스템과 창의성 지원 도구를 결합하는 개념에서 비롯된다(Rezwana & Maher, 2022). 이를 위해서는 인간과 AI를 행위자로 간주하고 인간 상식과 창의적 지능이 소통하는 방법과 성공적인 협업을 위한 고려 요소는 무엇인지를 탐구하는 것이 필요하다. Deterding et al.(2017)은 인간 또는 AI 주도 창작 활동에서의 선택 의지와 의도의 스펙트럼을 제안했다. 이 스펙트럼에는 AI가 창의적 프로젝트에서 수행할 수 있는 다양한 유형의 역할이 있는데, 인간이 수행 할 특정 작업을 대신하는 보조 역할, 도전을 제공하는 동기부여 역할, 결과를 생성하는데 동등한 역할을 수행하는 협력적 역할이 포함된다. Zeng, Sun, & Liao(2019)는 AI가 통합된 디자인 사이클을 제시하며 AI가 디자인 다양성을 생성하고 인간이 이를 검토, 통합할 수 있어 디자인 프로세스를 효율적으로 반복할 수 있다고 했다. Wu et al.(2021)은 AI를 통한 ‘인식’ 향상 단계, AI가 도출한 영감과 탐구로 인간이 효율적인 방식으로 깊고 넓게 ‘사고’하는 단계, AI를 활용해 다양한 아이디어와 창의성을 최적의 프레젠테이션으로 ‘표현’하는 단계, 인간과 AI가 각 주체의 장단점을 이해하고 최선의 임무를 부여해 경쟁하는 ‘협업’ 단계, AI를 통해 생품질을 높이고 비용을 절감하며 미래를 예측하고 대비하는 ‘구현’ 및 ‘테스트’ 단계를 아우르는 HAIC 순환 프로세스를 제안했다. 한편, Chung & Lee(2023)는 HAIC 프로세스와 패션 디자인 영역에서의 HAIC 사례 고찰을 통해 창의적 패션 디자인을 위한 HAIC 프로세스를 의미론적 데이터 통합, 시각적 관념화, 디자인 창조 및 확장, 디자인 프레젠테이션, 설계·제조솔루션 및 사용자 경험 플랫폼 생성 단계로 도출하였다. 그리고 이러한 HAIC는 인간의 능력 및 창의성 증강, 효율적인 워크플로 달성, 새로운 가치 창출에 기여할 수 있는 한편, 성공적인 패션 디자인 생성을 위해서 인간은 디자인 목표와 일치하는 결과를 생성하도록 AI를 큐레이션하는 동시에 새로운 아이디어와 예상치 못한 생성물에 대한 개방성 사이에서 균형을 찾기 위해 AI에 대한 이해, 명확한 비전, 광범위한 지식과 정보, 예리한 시각적 취향과 창의성을 갖는 것이 중요하다고 지적하였다.

이상의 연구들을 종합하면 패션 디자인 영역에서 성공적인 HAIC를 위해서는 인간과 AI 주체의 장·단점을 이해하고, 디자인 목표와 일치하는 결과를 생성하기 위한 최적화된 과업을 주체에게 부여, 긴밀하게 상호작용하여 전문성과 의도를 중시하는 인간과 인식을 향상시킬 수 있는 AI가 협업 할 수 있는 창의 프로세스가 필요함을 알 수 있다. 본 연구에서는 창의적 영역에서의 HAIC 관련 선행연구와 패션 디자인 사례 고찰을 통해 창의적 패션 디자인을 위한 HAIC 프로세스를 제시하고 있는 Chung & Lee(2023)의 연구를 토대로 HAIC에 의한 패션 이미지 생성을 의미론적 데이터 통합, 시각적 관념화, 디자인 창조 및 확장 단계에 적용하여 실시하고자 한다.

3. Text-to-Image 생성 AI 모델

AI는 텍스트 설명에서 개념, 속성 및 스타일을 결합한 창의적인 이미지를 생성할 수 있다. ‘text-to-image 생성’이라는 용어는 인간이 작성한 텍스트 프롬프트를 동일한 의미를 지닌 시각적 표현으로 바꾸는 컴퓨터 기반 방법을 의미한다. 대량 이미지 데이터와 그에 대응하는 텍스트를 학습한 AI가 통계적으로 추론해 적절한 이미지와 텍스트 조합을 찾아내고, 다양한 스타일과 장르의 이미지를 생성할 수 있는 것이다(Park, 2023). 최근 텍스트 기반 이미지 생성 AI 기술은 빠르게 발전하고 있다(Lee & Choi, 2023). 이러한 AI의 눈에 띄는 성과는 커진 데이터 셋의 규모와 최신 생성모델 기법의 적용이라는 두 가지 측면에서 기인한다. 기존의 데이터 수집 방법인 사람이 이미지 캡션을 직접 레이블링하는 방식은 대규모 데이터 구축에 한계가 있었다. 하지만 최근 모델들은 웹 크롤링을 통해 얻은 텍스트와 이미지 데이터 쌍을 이용하기 때문에 대규모 데이터 셋을 손쉽게 구축 할 수 있다. 그리고 이러한 대규모 데이터를 학습한 최신 생성 모델 기법인 DM(diffusion model)은 놀라운 결과물들을 보여주며, 이미지 생성 성능을 크게 향상하고 있다(Lee, Yun, Park, Hyung, & Choo, 2022). Text-to-image AI에서 활용되는 대표적인 모델로는 GAN(generative adversarial networks), CNN(convolution neural network), DM, LDM(latent diffusion model) 등이 있다. 이미지 생성 AI의 초기 버전은 GAN을 기반으로 했는데, 이는 이미지를 생성하려는 생성자(generator)와 생성자가 만든 이미지와 실제 이미지를 구분하는 감별자(discriminator) 역할을 하는 두 개의 신경망이 이미지를 생성한다(Cui, Kim, Choi, & Lee, 2022). GAN은 새로운 이미지를 만들어낸다는 점에서는 획기적이나 고해상도 이미지를 생성할 수 없고 학습이 불안정하다는 한계점이 있었다.

CNN은 이미지 인식에 활용되는 신경망으로, 생물의 시각 처리 과정을 모방해 패턴의 크기나 위치가 바뀌어도 인식할 수 있는 장점이 있다. CNN은 입력 이미지를 특성 맵(feature map)으로 변환한 다음 여러 합성곱(convolution) 및 풀링(pooling) 레이어를 통해 처리하여 예측 출력을 생성하는 방식으로 작동한다(Koushik, 2023)<Fig. 1>. 합성곱 레이어가 입력 이미지에 일련의 필터를 적용, 입력 이미지의 특정 측면을 강조하는 특성 맵을 생성하면, 풀링 계층은 인접 데이터들을 대표적인 값으로 변환하고, 그 값을 기반으로 처리하고 데이터 연산의 크기를 감소시키는 등 다양한 기능을 수행한다(Lee & Kim, 2023). CNN의 대표적인 예는 구글(Google)의 딥드림(Deep Dream)으로, 이미지를 입력하면 딥러닝된 알고리즘이 이미지 속에 담긴 요소를 잘게 쪼개 어떤 내용의 물체인지 인식하는 특정 패턴을 찾고 사용자가 AI 이미지 패턴을 설정하면 기존 이미지 내용은 유지한 상태에서 설정한 질감이 표면에 입혀지는 방식으로 이미지를 생성한다(Shin, 2019).

<Fig. 1>

The General Structure of CNNs(Koushik, 2023)

DM은 훌륭한 생성 결과와 안정적 학습이 가능해 이미지 생성 분야에서 많은 주목을 받고 있다. 사진의 픽셀이 시간이 지나면 노이즈로 변한다는 것을 참고해 만들어진 DM은 대규모의 데이터 학습이 가능하기 때문에 고해상도의 폭넓은 범위의 이미지 생성이 가능하다(Yang et al., 2023). GAN이 생성자와 감별자로 나뉜다면 DM은 정방향 변환과 역방향 변환으로 나뉜다<Fig. 2>. 정방향 변환은 데이터가 노이즈로 변하는 것을 의미하고 역변환은 여러 단계에서 매개변수를 활용해 노이즈로부터 새로운 데이터를 생성하는 것을 뜻한다(Kim, 2022). DM은 확산 과정, 즉 무작위 노이즈에 의해 주도되는 연속적인 변화를 통해 데이터의 복잡한 구조를 학습한다. 확산 모델의 핵심 아이디어는 높은 차원의 데이터 공간에서 확률적 변화를 모델링하는 것이다. 초기 상태는 일반적으로 랜덤 노이즈로 설정되고, 그 다음 이 데이터가 확률적 확산 과정을 거치면서 점차적으로 원하는 데이터 분포에 가까워지는 것을 학습한다(Lee & Kang, 2023). 즉, 노이즈 제거 U-Net을 통해 학습한 이미지를 통해 새로운 이미지를 만드는 원리로, U-net은 스킵 연결을 평행하게 두고 가운데를 기준으로 좌우가 대칭이 되도록 레이어를 U자 형으로 만든 신경망 구조를 의미한다. 이러한 DM모델은 Open AI의 ‘달리(DALLㆍE) 2’에 사용되었다(Park, 2022).

<Fig. 2>

Architecture of DM(left) and LDM(right)(Pranav, 2023)

한편, LDM은 잠재 확산이라는 의미로, 확산 과정이 픽셀 공간이 아닌 잠재(latent) 공간에서 작동하기 때문에 DM보다 더 빠른 이미지 생성이 가능하다. LDM의 구조<Fig. 2>를 살펴보면 먼저, 이미지 데이터를 저차원 표현으로 압축하는 방법을 학습하도록 오토 인코더를 훈련하게 되는데, 학습된 인코더 E를 사용해 전체 크기 이미지를 저차원 잠재 데이터(압축 데이터)로 인코딩한 후 잠재 공간에서 순방향 프로세스가 수행된다. 압축된 행렬에 노이즈를 더하고 복구하는 방법을 진행하여 추출된 특징을 포함하는 깨끗한 코드를 생성한다. 이러한 특징을 포함하는 코드의 차원은 이미지의 차원보다 훨씬 낮기 때문에 DM의 학습속도를 향상시킬 수 있다. 그리고 LDM은 내부확산 과정에서 조건 입력을 허용하도록 내부 확산모델을 수정하여 수행되는데, U-Net을 강화하여 조건부 이미지 생성기로 전환된다. 다이어그램에서 스위치는 다양한 유형의 조건 입력을 제어하는데 사용된다. 예컨대 텍스트 입력의 경우 텍스트는 먼저 언어 모델 τθ를 사용하여 임베딩(벡터)으로 변환된 다음, Attention(Q, K, V) 계층을 통해 U-Net에 매핑된다. 그리고 역확산 과정을 거쳐 노이즈를 제거, 훈련된 디코더 D를 사용하여 잠재 데이터를 다시 이미지로 디코딩하는 프로세스가 진행된다(Pranav, 2023). 스태빌리티(Stablilty)에서는 이러한 구조의 LDM과 고품질 이미지 데이터셋인 ‘LAION’을 활용해 고품질의 이미지를 생성하는 ‘Stable Diffusion’을 공개했다(Park, 2023).

이러한 text-to-image 생성에 있어서 텍스트 프롬프트는 중요한 역할을 한다. 인간 사용자의 비전을 명확히 설명할 수 있는 단어의 선택과 자극이 창의적 기술로 이미지의 품질 향상과 미학을 변화시키는 중요한 요소이기 때문이다(Zhou, Yang, Loy, & Liu, 2022). ‘프롬프트 엔지니어링’이라는 용어는 반복적이고 실험적인 특성을 통해 프롬프트를 작성하는 기술을 의미(Liu & Chiltion, 2022)하는데, 프롬프트를 시험하고 그것이 생성할 수 있는 이미지를 파악한 다음 새로운 지식을 사용하여 프롬프트를 반복적으로 개선하는 과정은 흥미로운 결과를 선택할 수 있도록 만든다. 따라서, 생성형 AI가 고품질의 창의적 결과물을 생성하려면 유능한 AI를 채택하는 것도 중요하지만, 정확한 인간 사용자의 생성물에 대한 개념과 이를 명확하게 설명하는 올바른 프롬프트를 신중하게 디자인하고 확보하는 것이 중요하다.


Ⅲ. 연구 방법 및 대상

AI가 인간 패션 디자이너에게 창의적인 패션 디자인을 도출할 수 있도록 지원하고 영감을 주는 공동 창작 파트너가 될 수 있는지 파악하기 위해 이미지를 생성할 수 있는 AI 에이전트를 채택하고 이를 활용해 창의적 패션 이미지를 생성하고 평가하는 프로젝트를 <Fig. 3>과 같이 진행하였다. 협업을 위한 AI 에이전트는 AI 평가 사이트에서 우수하다고 평가된 text-to-image AI<Table 1> 중에서 중복적으로 언급되고 있는 7개를 선정했다. HAIC를 프로세스는 패션 이미지 생성을 위한 프롬프트 및 디자인 소스 도출, 무드 보드 생성, 프롬프트 입력을 통한 패션 이미지 생성 및 큐레이션, 도출된 패션 이미지와 프롬프트의 일치성 판단, 창의성 및 AI 패션 에이전트 평가 순으로 진행하였다. 패션 이미지는 선행연구(Chung & Lee, 2023)의 창의적 패션 디자인을 위한 HAIC 프로세스에서 아이디어 생성에서 디자인 창조에 해당하는 프로세스를 토대로 하였으며, 이를 통해 디자인 개념, 무드 보드, 패션 이미지를 생성하였다.

<Fig. 3>

Research Process

AI Image Generator Rated as Excellent on AI Evaluation Site

본 연구에서 활용하는 AI 에이전트의 특성 <Table 2>을 살펴보면, 먼저 아트브리더(Artbreeder)는 간단한 조작 과정, 협업과 유전자 알고리즘 결합을 통해 이미지 혼합과 리믹스 등 이미지 품질 향상에 가장 적합한 생성기이다. 구체적으로 ‘splicer AI’는 이미지를 혼합하고 결합하면 유전자와 특성을 편집할 수 있으며, 초상화, 풍경, 그림 등을 포함한 다양한 예술적 스타일과 장르가 제공된다. 달리 2 역시 직관적이고 쉬운 인터페이스로 이미지 생성 과정이 자연스러우며, 사실적인 이미지 생성에 적합하고 이미지 생성을 위한 별도의 옵션은 제공되지 않지만 페인트 브러시 기능을 사용하면 하이라이트, 그림자 같은 세부 정보를 추가하는 등, 인페인팅, 아웃페인팅, 시점 변경 등이 가능하다. 딥 드림 제너레이터(Deep Dream Generator)는 아트 스타일 연출에 특화되어 있는데, ‘text to dream’은 이미지 생성, ‘deep style’은 아트 스타일 선택, ‘deep dream’은 기존의 이미지를 다른 이미지로 변환하는 등을 시도할 수 있으며, 다양한 해상도의 이미지 출력, 인페이팅, 배경삭제, 반복 및 수정 가능 등이 가능하다. 재스퍼(Jasper)는 간단하고 쉬운 인터페이스를 지니며, 참고용 이미지 업로드, 아트 스타일과 매체, 분위기 등 사용자 정의가 가능한 스타일 및 세부 사항을 제공하지만 이미지 합성이나 인페이팅, 아웃페이팅 등의 기능은 없다. 미드저니(Midjourney)는 고품질 이미지 생성에 적합하고, ‘discord’ 시스템 내에서 작동한다는 점을 특징으로 한다. ‘discord’ 내 챗봇에 생성을 위한 메시지를 보내거나 봇을 제3자 서버에 초대하는 방식으로 액세스하기 때문에 실시간으로 생성되는 이미지의 퀄리티와 다양성을 쉽게 파악하고 다른 참여자들과의 상호작용과 아이디어 교환, 생성물을 통해 영감을 얻을 수 있다. 이미지를 생성하려면 인간은 ‘/imagine’ 명령어를 사용해야 하고 생성된 4개의 이미지를 변경하는 옵션을 활용할 수 있다. 미드저니는 채팅플랫폼에 접속하고 플랫폼 이해도가 없는 사용자에게 불편함이 따를 수 있다는 특징이 있고, 다른 사용자들의 이미지와 혼동되어 작업의 주목도가 떨어지고 개인적인 작업 공간을 확보하는 느낌이 부족할 수 있다. 나이트카페(NightCafe)는 태블릿 또는 모바일 장치 등에서 활용할 수 있는 접근성이 좋은 플랫폼으로 가장 큰 장점이 이미지를 생성할 때 알고리즘을 지정할 수 있고, 선택 후에는 아트 스타일과 해상도, 사이즈 등을 결정할 수 있다. 스타리AI(StarryAI)는 무료 NFT 생성에 적합한 접근성 좋은 플랫폼으로 다양한 모델, 스타일, 사이즈 및 초기 이미지를 포함한 다양한 사용자 정의 옵션을 제공하며, 맞춤형 AI 아바타를 생성할 수 있다. 이상과 같이, AI 에이전트들은 대부분 쉽고 직관적인 인터페이스를 지녀 이미지 생성이 간단하고 빠르게 이루어짐을 알 수 있었다. 그리고 대부분의 AI 에이전트들이 사용자가 원하는 이미지 생성을 돕기 위해 참고 이미지를 활용하거나 스타일 옵션을 활용할 수 있는 기능, 해상도 조정, 자동 이미지 변형, 인페이팅 옵션 등을 제공하고 있었다. 한편, 이미지 합성, 아웃페인팅 기능 등은 아트브리더, 달리 2, 미드저니만이 모두 보유하고 있었고, 딥 드림 제너레이터, 나이트카페, 스타리AI는 인페인팅 기능만이 가능했다. 그리고 재스퍼의 경우에는 프롬프트와 참고 이미지를 토대로 이미지를 생성할 수 있는 기능만을 지니는 것으로 나타났다.

AI Image Generator’s Characteristics

패션 이미지 생성은 두 가지 개념으로 수행되었다. 첫 번째는 지속가능한 패션으로, 패션 영역에서 지속가능성은 환경적인 문제가 국내외의 사회 이슈로 주목받으면서 지속가능한 연구개발에도 많은 영향을 끼치고 있기 때문이다(Yeon & Park, 2020). 두 번째는 한국적 패션으로, AI가 생성하는 이미지에는 문화적, 민속적, 다양한 유형의 AI 편견, 또는 부정확성이 반영될 수 있기 때문에 AI 에이전트가 민속적 특성을 잘 이해하고 이를 토대로 패션 이미지를 생성할 수 있는가를 확인했다. 지속가능한 패션과 한국적인 패션 이미지 생성 과업을 위한 AI 입력 소스로서 텍스트 프롬프트는 <Table 3> 과정을 통해 도출되었다. 각 패션과업에 대한 개념은 선행연구 및 Chat-gpt 4의 “What is the sustainable fashion design?”, “What is the Korean fashion design?”라는 질문에 대한 응답 내용을 토대로 키워드를 수집하고 이를 패션 매거진에서 언급된 2024 S/S 패션 트랜드 키워드를 조합해 설계했다. 프롬프트 도출에서 Chat-gpt 4에 “What is the 2024 S/S fashion trends?” 질문하였지만, 이에 대한 응답으로 “2022년 1월 마지막 업데이트를 기준으로 2024년 S/S 패션 트렌드에 대한 구체적인 정보가 없다.”는 답변을 받았기 때문에 이와 관련된 키워드는 매거진을 통해서만 수집했다. 그리고 각 프롬프트에 포함된 주요 키워드를 AI 에이전트에 입력하고, 이에 대한 무드 보드를 <Table 4>와 같이 생성했다.

Prompt Derivation Process for Fashion Design Creation

Mood Board through HAIC

HAIC에 의한 패션 이미지 생성은 도출된 프롬프트를 각 AI 에이전트에 입력하고, 인간 디자이너의 초기 지침, 변수 설정 등의 큐레이션을 통해 각각의 생성 과업을 수행하여 이미지를 도출하였다. 초기 프롬프트 입력으로 생성된 패션 이미지는 각각 4종으로, 7가지 AI 에이전트에서 제공하는 아트 스타일, 무드 등의 옵션에 있어서 사진형식의 사실성이 강조된, 세밀한 묘사가 나타날 수 있는 옵션을 활용하여 이미지를 도출하되, 인간 디자이너의 이미지 합성과 브러쉬툴과 인페인트 등은 활용하지 않아 AI 에이전트가 자동적으로 생성하는 이미지를 평가할 수 있도록 했다. 평가 내용은 HAIC를 통해 생성된 이미지의 패션이 프롬프트 내용을 반영하는지와 창의성, 인간 패션디자이너에 의한 큐레이션을 통해 도출된 디자인 특성 등이었다. 그리고 적극적인 인간 큐레이션에 의한 패션 디자인 베리에이션 특성을 살펴보기 위해서는 각각의 AI 에이전트들이 생성된 패션 이미지 중 프롬프트를 잘 반영하고 있고 창의성 평가에서 높은 점수를 나타내어 디자인 베리에이션에 적절하다고 판단되는 이미지를 채택하고 이를 AI 에이전트가 제공하는 이미지 합성, 인페이팅, 아웃페인팅 기능 등의 인간 디자이너의 큐레이션을 적용해 패션 디자인의 변형 및 전개를 시도하였다. 인간 패션 디자이너의 큐레이션에 있어서 한국적인 패션 이미지들은 프롬프트를 제대로 반영하지 못했고 창의성 평가에서도 낮다고 평가되었기 때문에 첫 번째 과업에서 도출된 이미지를 중심으로 선정했다.

HAIC를 통한 패션 이미지에 있어서 텍스트 이해와 표현은 프롬프트에 활용된 패션 디자인 요소에 대한 반영 여부를 체크하는 것으로 평가했는데, 특히, 한국적 패션 디자인에서 AI가 한복과 저고리 등의 용어를 이해하고 올바른 이미지를 생성하였는지 확인하기 위해서는 Lee, Han, & Kang(2017)의 논문에 언급된 한복 및 저고리 형태 및 구성 요소를 기준으로 반영 여부를 판단했다. 그리고 생성된 패션 이미지의 창의성에 대한 평가는 패션 디자인 전문가 4인이 참여하여 창의성 평가 지표에 대한 정도를 워크시트에 체크하면 이를 종합하여 평균값을 구하는 방식으로 평가하였다. 평가 지표는 CAT와 CPSS, Kim & Lee(2004)Song(2018)의 연구를 토대로 추출된 참신성, 기술성, 정교성, 심미성 등 4개의 지표로 구성하였다. 창의성 평가 과정은 패션 디자인 전문가 4인이 HAIC를 통해 생성된 각각의 패션 이미지를 보고 4개의 지표에 대해 전문가들간 협의 없이 패션 이미지만 보고 각각 독립적으로 평가하되, 이미지간 상대 평가를 통해 점수를 부여하도록 하였다. 전문가들은 6점 리커트 척도로 이루어진 평가지를 통해 평가하였으며, 창의성이 가장 낮은 1점부터 창의성이 가장 높은 6점까지 패션 이미지간 비교를 통해 골고루 점수를 부여하도록 요청 받았다. 또한 평가지는 동일한 패션 이미지로 이루어졌으나 순서가 다르게 배치하고 각각의 평가자에게 임의로 부여했다. 이미지 베리에이션 및 AI 에이전트에 대한 인간 큐레이션, HAIC 가능성에 대한 부분은 앞서 분석된 텍스트 이해와 표현 능력 및 창의성 평가 결과와 연구책임자 주도로 반복적인 HAIC, 큐레이션 과정에서 경험한 것을 토대로 내용을 정리하였다. 이 과정에서는 주관적 분석을 최소화하기 위해 최대한 여러 차례 AI 에이전트에 접속하고 관련 문헌 및 자료들을 고찰했으며, 평가에 참여한 연구자들과 경험을 공유하였다.


Ⅳ. HAIC를 통한 창의적 패션 이미지

1. AI 에이전트에 의한 패션 이미지 생성

각 과업에 해당하는 프롬프트를 AI 에이전트에 입력함으로써 생성된 패션 이미지는 <Table 5>와 같다. 패션 이미지 생성을 시도한 결과, 동일한 프롬프트를 이용했지만 AI에 따라 다른 무드, 실루엣, 디테일의 배치와 활용이 나타났으며, 같은 AI 에이전트에 매번 동일한 프롬프트, 초기 지침, 변수 설정을 입력하더라도 다른 조형성을 지닌 이미지들이 생성되었다. 달리 2를 제외한 모든 AI 에이전트들을 통해 생성된 고해상도의 이미지들은 패션 디자인의 질감이나 형태들이 잘 인식되는 특징이 있으며 딥 드림 제너레이터를 제외한 모든 AI 에이전트에서 개수에는 차이가 있지만 한 번에 4~16개까지의 유사한 계열의 이미지를 한 번에 생성할 수 있는 기능과 생성시 프롬프트와 이미지를 입력하고 이를 기반으로 이미지를 생성하는 기능을 지녀 디자인 베리에이션이 가능했다.

Fashion Images through HAIC

생성된 패션 이미지에 대해 프롬프트에 나타난 20가지 패션 요소가 반영되었는지를 <Table 6>과 같이 평가한 결과, 아이템 종류와 볼륨감과 길이, 소매 형태에 대한 키워드, 컬러와 소재, 문양, 오프워크 등 소재에 대한 키워드 등은 이미지 생성에서 잘 반영된 것으로 나타났다. AI 에이전트 가운데 재스퍼, 스타리AI, 달리 2는 각각 17개, 16개 패션 디자인 요소가 반영되어 비교적 우수한 프롬프트 이해 및 패션 디자인 표현 능력을 지녔는데 특히, 재스퍼와 스타리AI의 경우, 생성 이미지에 따라 다소 차이가 있었지만, 만족할만한 수준에서 스포티한 이미지, 구조적인 소매 형태, 슬래시 탑, 컨버터블 스커트, 화이트 컬러, 재활용 플라스틱, 오픈 워크 소재의 패션과 볼륨감 있고 긴 한복 스타일, 슬림 팬츠, 깃털과 장미 디테일의 입체적인 장식, 블랙 실크, 메탈릭한 동양적 붓 터치 문양이 반영된 패션이 잘 나타남을 알 수 있었다. 그리고 재스퍼, 미드저니, 나이트카페 등의 AI 에이전트를 통해 생성된 이미지들은 재활용 플라스틱과 메쉬, 메탈릭, 실크, 깃털 소재의 사실적이고 섬세한 표현이 눈에 띄었다. 반면, 달리 2는 패션 디자인 요소는 대체적으로 잘 반영하고 있지만 사실적이고 실제적인 이미지로 변환하는 기능이 우수하다는 매체의 평가(DALLE-2, 2023)와는 달리 인물과 패션 이미지가 다소 추상적이고, 왜곡되어 있음을 알 수 있었다. 한편, 아트브리더와 딥 드림제너레이터는 각각 7개와 12개 패션 요소가 반영되어 인간 패션 디자이너가 지정한 패션 아이템의 디테일이나 소재 등의 디자인 요소의 반영이 미흡한 것으로 나타났다. 먼저 아트브리더는 독특한 조형이 나타나는 아트웨어를 제안하지만, 패션 아이템 간의 구분이 모호하고 다소 해석하기 난해한 경향이 있는 반면, 딥 드림 제너레이터는 기성복에 가까운 형태와 디테일이 나타났다. 그리고 두번째 과업에서 ‘한복’, ‘저고리’에 대한 키워드는 거의 모든 AI 에이전트들이 정확한 이해를 토대로 이미지를 생성하고 있다고 판단하기 어려웠다. 대표적으로 달리 2와 재스퍼, 스타리AI를 통해 생성된 일부 이미지를 제외한 대부분의 이미지들에서 ‘Hanfu’라고 불리는 중국 복식과 머리 형태, 또는 치파오, 일본의 기모노를 연상시키는 디테일들이 나타났다. 특히, ‘저고리’ 키워드는 고름, 섶 등의 요소들이 생성된 이미지에서 나타나지 않아 AI 에이전트들이 해당 용어에 대한 학습이 거의 이루어지지 않았음을 예상할 수 있었다.

Reflection of Design Depiction in Generated Fashion Designs○ : satisfied, △ : Insufficient × : unsatisfied

HAIC를 통한 패션 이미지의 창의성을 평가한 결과는 <Table 7>과 같다. 분석 결과, 창의성 평가요소에 있어서 지속가능한 패션 이미지와 한국적 패션 이미지 생성물에 있어서 전문가들은 다른 평가를 하였는데, 대체적으로 한국적 패션 이미지에 대한 평가 점수가 지속가능한 패션 이미지보다 창의성 평가 척도에 대한 점수가 낮았는데, 특히 참신성에서 차이가 크게 나타났다. 그리고 창의성 척도에 있어서 정교성이나 참신성, 심미성에 비해 기술성은 전반적으로 낮은 점수를 나타냈는데, 전문가들이 AI 에이전트의 묘사나 사실적인 표현능력, 이미지에 내포된 기발하거나 새로운 요소, 심미적 매력도 등은 창의성 4-5 레벨의 중·상, 상위 등급으로 우수하게 생각한 반면, 프롬프트에 나타난 키워드의 부분적 누락, 실재 구현 및 활용 측면에 있어서는 중간 수준의 등급으로 상대적으로 낮게 평가하였음을 보여주었다. 그리고 전문가 들은 미드저니가 생성한 패션 이미지들에 대해 참신성과 정교성, 심미성이 우수하다고 평가했는데, 지속가능한 패션은 참신성 기술성, 정교성, 한국적 패션 이미지는 참신성, 정교성, 심미성이 다른 AI 에이전트의 생성물 가운데 가장 높은 점수를 나타냈다. 그리고 앞서 언급한대로 대부분 지속가능한 패션 이미지에 대한 평가 점수가 높게 나타났는데 특히 아트브리더의 경우, 정교성과 참신성, 심미성이 모두 좋게 평가되었으며, 나이트 카페의 패션 이미지에서는 참신성, 정교성, 심미성, 재스퍼와 스타리 AI의 패션 이미지에서는 정교성이 높게 나타났다. 한편 딥 드림 제너레이터는 대부분의 창의성 척도에서 낮은 점수를 나타내고, 달리 2는 정교성과 심미성, 그리고 한국적 패션 이미지의 참신성이 낮게 나타나 다른 AI 에이전트가 생성한 패션 이미지들보다 전반적으로 낮은 창의성을 지니는 것으로 평가되었다.

Creativity Evaluation of Fashion Iages through HAIC Mean Value

2. 인간 큐레이션에 의한 패션 이미지 베리에이션

인간 큐레이션에 의한 패션 이미지 베리에이션은 각각의 AI가 생성한 패션 이미지 중 패션 요소를 잘 반영하고 창의성 평가에서도 높은 점수를 나타내 디자인 베리에이션에 적절하다고 판단되는 이미지를 선정하고 이를 AI 에이전트의 이미지합성, 인페이팅, 아웃페인팅 등의 기능을 활용하여 패션 이미지를 <Table 8>과 같이 생성했다. 이는 앞서 고찰한 AI 기능<Table 2>에 있어서 사용자 옵션으로는 제시되지만 실재적으로 인간 큐레이션을 시도했을 때 패션 이미지 베리에이션, 변형 등이 잘 이루어지는지를 확인하기 위한 것이다. 이미지 합성은 동일한 AI 에이전트에서 생성된 패션 이미지 중에서 선정했고 인페이팅 또는 아웃페인팅은 해당 이미지의 상의와 하의, 다리 및 신발부분을 마스킹하고 “Wearing a cut-out silvercolored top, thigh-high boots, and a knee-length convertible skirt.”라는 프롬프트를 입력해서 전신 이미지가 나타나도록 하였다. 한편, 재스퍼는 사용자가 제공하는 이미지를 토대로 베리에이션을 전개할 수 있을 뿐 이미지 편집 및 변형 기능을 제공하지 않는 관계로 큐레이팅을 실시하지 못했다.

Fashion Images Variation by Human Curation

인간 패션 디자이너의 큐레이션으로 생성된 패션 이미지들은 각 AI 에이전트에 따라 완성도 및 반영 정도의 차이가 있지만, 인간의 감수성으로 이미지를 선별하고 개인적 관점에 따라 조정될 수 있음을 보여주었다. AI 에이전트 가운데 특히 아트브리더는 이미지 합성뿐 아니라, 인페인팅, 아웃페인팅, 콜라주, 포저(poser) 등 이미지 생성 시큐레이션할 수 있는 가장 다양한 기능을 제공하고, 생성되는 패션 이미지 또한 유사한 특징을 지니는 이미지들이 나타났다. 또한, 아트브리더는 패션 이미지에서 모델의 피부색, 나이, 성별, 얼굴 특징 등, 30개 이상의 유전자를 리믹스하고 편집해 새로운 정체성을 만들고 콜라주를 기능을 사용하면 다양한 이미지, 컬러, 도구를 결합해 새로운 이미지를 생성할 수 있으며, 선호하는 모델의 포즈 이미지와 스타일 이미지를 각각 업로드하면 AI가 포즈와 스타일을 분석해서 지정된 포즈에 프롬프트가 적용된 패션 이미지를 도출할 수 있었다. 즉, 아트브리더는 패션 이미지들 가운데 종종 인체 및 패션 오브젝트가 왜곡·해체적으로 나타나는 경향도 있었지만 다른 AI 에이전트에는 없는 다양한 기능들을 제공함으로써 인간 패션 디자이너가 주도적으로 큐레이션 할 수 있는 특징이 있음을 알 수 있었다. 반면, 달리 2는 이미지 베리에이션, 합성, 인페이팅, 아웃페인팅이 모두 가능하지만 선택할 수 있는 스타일 없어 선택의 제한적이고, 이미지 결과를 기반으로 다른 베리에이션을 요청했을 때 생성되는 이미지들이 예측 불가능 하거나 유사한 특징을 보이지 않는 경향이 다른 에이전트에 비해 높았다. 또한, 인물과 패션 이미지가 다소 추상적이고, 왜곡이 심하며 이미지 합성에서 자연스러움이 떨어졌다. 미드저니는 큐레이션 기능을 제공하는 AI 에이전트 가운데 재질감, 음영, 정교한 묘사 등 가장 자연스럽고 사실적인 이미지를 제공한다는 특징을 지녔다. 그리고 미드저니에서 생성된 패션 이미지는 정교한 표현력을 지니며, 이미지 합성, 인페이팅, 아웃페인팅 등 다양한 큐레이션 기능을 제공하지만 AI 봇과의 상호작용, 특정 언어 및 형식을 요구하는 명령과 매개변수 등 채팅 플랫폼 도구에 익숙하지 않은 사용자의 경우 사용자 인터페이스에 대한 학습이 필요했다. 즉, 아트브리더, 달리 2, 미드저니 중 아트브리더는 인간 패션 디자이너의 구체적인 목표에 따라 변형을 시도할 수 있는 사용자 큐레이팅 기능이 있어 사용자 측면에서 상호작용이 가능하다고 느낄 수 있는 특징을 지니고, 미드저니는 다양한 디자인 디테일 베리에이션, 가장 사실적이고 정교한 시각화 능력이 있는 것으로 나타났다. 달리 2는 왜곡되고 사실적이지 않은 생성물이 완성도를 떨어뜨리는 측면도 있지만, 예측 불가능한 특징과 추상성이 인간 디자이너의 해석 능력에 따라 다양한 표현으로 구현될 가능성을 지니는 것으로 나타났다. 한편, 딥 드림 제너레이터, 나이트카페, 스타리AI는 인페이팅 기능만이 가능했다. 먼저, 딥 드림 제너레이터는 인간이 지정한 이미지에 대해 마스킹과 인페이팅 기능을 활용해 다른 디테일과 재질로의 변형을 시도하고 고품질의 사실적인 이미지를 생성하는 것, 이미지 프레임 조정, 반복 및 수정 등은 가능했지만, 아웃페인팅 기능이 없어서 기존 이미지에서 나타나지 않았던 신체 부위가 있는 경우, 수정 및 변형이 불가능했다. 나이트카페와 스타리AI는 다양한 스타일과 선호도에 따라 이미지를 변형하는 것이 가능하고, 마스킹 기능과 프롬프트 및 구체화 가중치, 구조, 컬러, 깊이감 등을 지정할 수 있거나 스타일을 적용하여 새로운 표현이 가능했다. 구체적이고 정교한 패션 이미지 묘사 능력은 딥 드림 제너레이터가 우수한 한편, 이미지 베리에이션은 나이트카페와 스타리AI가 비교적 우수한 특징을 지니는 것으로 나타났다.

3. HAIC를 통한 패션 이미지 생성을 위한 AI 특성

HAIC를 통한 패션 이미지 생성과 인간 큐레이션에 의한 패션 이미지 베리에이션에 의해 고찰된 내용을 토대로 AI 에이전트의 생성 능력 및 상호작용 특성 및 HAIC 가능성 등을 정리한 결과는 <Table 9>와 같다. 아트브리더는 일반적 형태 및 색상을 비교적 잘 이해하는 한편, 민속적 복식 용어에 대한 낮은 이해로 왜곡된 패션을 생성했고 아이템 구성과 디테일, 재질 등의 요소에 대한 사실적이고 상세한 묘사력은 다른 AI와 비교했을 때 보통 수준이었다. 그러나 구조적인 패션 실루엣 형성이 가능하고 이미지 합성이나 콜라주, 인페이팅, 아웃페인팅, 포저 등 사용자가 주도적으로 큐레이션 할 수 있는 다양한 옵션이 내포되어 인간 디자이너가 자유롭게 패션 이미지를 창작할 수 있었다. 그리고 이미지 베리에이션에서 왜곡, 키워드 미반영의 경우가 발생하기도 했지만 대체적으로 유사한 특징을 나타내는 패션을 생성하고 옵션에 따라 수정이 가능한 여지가 존재함으로써, 이미지 변형 및 전개가 가능했다. 즉, 아트브리더는 다양한 사용자 큐레이션 옵션을 제공하고, 주제에 따라 차이가 있지만 대체적으로 우수한 프롬프트 기반 이미지를 생성할 수 있으며, 생성물이 놀라움을 줄 수 있는 참신성과 심미성을 지녀 인간 패션 디자이너에게 영감을 줄 수 있어 패션 디자인을 위한 HAIC에서 적절한 에이전트로서 역할 할 수 있을 것으로 판단되었다.

Features of AI Agents on Fashion Image Creation○ : satisfied, △ : Insufficient × : unsatisfied

달리 2는 일반적인 형태와 색상에 대한 이해 등의 기술성이 준수하지만 생성된 패션 이미지는 사실성이 떨어지고, 낮은 해상도로 패션 디자인의 구체적인 형태와 요소에 대한 상세한 시각적 설명이 부족한 낮은 정교성을 띄었다. 그러나 한국적 이미지의 패션에서는 AI 에이전트 가운데 한복이미지를 가장 잘 묘사하고 있음을 알 수 있었다. 인간 큐레이션에서는 이미지 블렌딩, 인페이팅, 아웃페인팅이 가능하지만 변환을 위한 옵션이 부족하고, 합성된 부분의 왜곡과 불완전성이 다른 AI 에이전트보다 다소 많았으며, 생성된 이미지 간의 낮은 유사성이 나타났다. 즉, 달리 2는 대체적으로 프롬프트를 잘 반영하지만 다른 AI 에이전트에 비해 낮은 참신성과 정교성, 심미성 등이 사용자로 하여금 충분한 AI 통제력을 느끼기에는 부족함이 있을 수 있음을 알 수 있었다. 그러나 참신한 패션 이미지나 사실적이고 구체적인 패션 이미지를 요구하지 않고 프롬프트를 실험하고 추상적인 이미지를 생성하는데에 있어서는 수용가능한 AI 에이전트라고 할 수 있었다.

딥 드림 제너레이터는 프롬프트에 내용 중 색채와 문양을 제외하고, 소재 특성, 형태, 디테일을 설명하는 단어들이 충분히 반영되지 못했으며, 의외의 요소가 거의 없는 일반적인 패션 이미지가 생성되었다. 이에 따라 창의성 척도 중 참신성과 기술적이 가장 낮게 평가되었다. 그리고 인간 큐레이션에 의한 전환을 위한 옵션이 부족하고, 인페이팅에 의해서도 변형 정도가 매우 제한적으로 나타나 낮은 상호작용으로 인해 HAIC 가능성이 낮게 평가된다고 할 수 있다. 그러나 다른 AI 에이전트 가운데 가장 깔끔하고 정돈된 느낌의 사실적인 패션, 인물이 표현된 이미지를 생성함으로써 정교성이 높아서 현실적이고 실용적인 패션 이미지를 연출하는데에는 적합한 것으로 나타났다.

재스퍼는 민속적 요소를 제외하고, 패션의 일반적인 형태와 색상에 대한 이해가 상대적으로 탁월하고, 현실적이고 자세한 설명이 가능한 의외의 요소들이 내포된 표현, 생성물을 실제화하기 충분한 사실적 이미지를 도출할 수 있었다. 인간 큐레이션은 아트 스타일, 무드, 매체 등의 초기 옵션 제공하는 것 외에 다른 이미지 변환 기능이 없어 생성된 패션 이미지를 인간의 요구에 따라 수정하는 것이 불가능해 낮은 수준의 상호작용성이 느껴졌다. 그러나 참고할 수 있는 이미지 업로드와 생성된 디자인 간의 높은 연관성이 디자인 베리에이션 측면에서는 유리하게 작용될 수 있었다. 따라서 재스퍼는 이미지 변환 큐레이션이 기능이 결여되어 있음에도 비교적 우수한 프롬프트 이해를 통한 패션 구성 및 재현 가능한 구성 및 이해가능성에 의한 기술성, 참신성과 정교성으로 패션 디자인을 위한 창의적인 제안이 가능하여 구체적인 패션 이미지를 보유한 경우, 더욱 효과적으로 HAIC가 잘 이루어 질 수 있음을 알 수 있었다.

미드저니는 민속적 요소를 제외하고 프롬프트에 나타난 패션의 일반적인 형태와 색상, 소재에 대한 이해가 상대적으로 준수했고, 현실적이고 자세한 설명이 가능한 아이템 구성, 메쉬, 매탈릭, 광택 소재 등 AI 에이전트 가운데 가장 다양한 재질감이 융합된 디자인, 실제화하기 충분한 사실적 이미지를 도출함으로써 전반적인 창의척도에서 높은 창의성 평가를 받았다. 그리고 이미지 블렌딩, 인페인팅, 아웃페인팅 기능을 보유하고, 매개변수 및 옵션에 따라 베리에이션 생성물 간의 상관관계를 조절할 수 있어서 비교적 구체적인 인간큐레이션을 시도할 수 있었다. 단, 미드저니는 특정 언어 및 형식을 요구하는 명령과 매개변수 등 채팅 플랫폼에 익숙하지 않은 사용자의 경우, 인터페이스에 대한 반복적인 시도와 학습을 요구했다. 즉, 미드저니는 준수한 프롬프트 이해를 바탕으로 참신한 요소가 내포될 수 있는 정교한 패션이미지 창작 및 표현 능력을 보유했을 뿐 아니라, 다양한 인간 큐레이션이 가능한 기능을 제공하고 이를 통한 창의적인 패션 이미지를 생성해 높은 HAIC 특성이 나타났다.

나이트카페는 패션 형태와 색상에 대한 이해가 상대적으로 좋았고, 실제 사진 느낌의 현실적이고 자세한 설명 가능한 정교한 이미지를 생성할 수 있는 특징을 지녔다. 전체적인 패션 이미지의 창의성 평가는 다른 AI 에이전트에 비해 낮았지만 지속가능한 패션 이미지에서 참신성과 정교성, 심미성은 높은 평가를 받았고 인페인팅 기능만을 보유해 사용자에게 상호작용을 위한 옵션이 부족한 느낌을 줄 수 있었다. 즉, 나이트카페는 민속 복식을 제외한다면 대체적으로 준수한 프롬프트 이해력, 제한적이지만 의미있는 변형이 가능한 인페이팅 기능으로 기술성과 정교성이 높은 패션 이미지 창작 및 표현 능력이 있으며, 이에 따라 패션 디자인 제안이 가능한 HAIC 특징이 있었다.

스타리AI는 프롬프트에 대한 이해가 상대적으로 우수하고, 구조적인 형태 표현이 가능했으며, 동시에 생성되는 이미지들의 경우, 만족스러운 연관성과 옵션에 따른 수정 가능한 특징을 지니고 있었다. 그러나 인간 큐레이션에 의한 이미지들의 경우, 유창한 패션 이미지들이 생성되기도 했지만 현실적이고 상세한 설명이 부족한 이미지, 추상성이 높은 이미지들이 도출되었다. 즉, 스타리AI는 준수한 프롬프트 표현 및 정교한 이미지 생성 능력을 지니고, 생성되는 이미지들에서 의외의 요소들이 나타나 창의적 디자인 제안이 가능하지만 인간 큐레이션에 의한 표현의 한계가 나타났다.

이상에서 살펴본 바와 같이, HAIC를 통한 패션 이미지 생성을 통해 7개의 AI 에이전트 가운데 아트브리더와 미드저니가 창의적 패션 디자인 생성을 위한 HAIC의 협업 에이전트로서 적합한 특징을 지니고 있음을 알 수 있었다. 아트브리더는 쉽고 빠른 이미지 생성 능력을 지니고 다양한 큐레이션 옵션을 제공하고 있을 뿐만 아니라, 프롬프트에 대한 이해도가 준수하고 대체적으로 높은 참신성과 심미성을 지닌 이미지를 생성할 수 있었다. 그리고 미드저니는 이미지 생성 방법에 대한 학습이 특별히 요구되지만 프롬프트에 대한 이해도가 준수하고 큐레이션이 가능한 기능을 제공하고 있으며, 참신성, 정교성, 심미성 등에 있어서 높은 창의성이 나타나는 패션 이미지를 생성해 높은 HAIC 가능성을 나타냈다.

즉, AI 에이전트들은 동일한 개념의 프롬프트에도 AI 특성과 학습 데이터에 따라 다양한 패션의 조형성을 지니고, 생성의 확률론적 특성에 의해 발생되는 예측 불가능한 요소들을 내포하고 있었다. 그리고 인간 패션 디자이너의 큐레이션을 가능하게 하는 AI 에이전트의 다양한 옵션들은 생성된 패션 이미지의 수정과 변형을 빠르고 유창하게 수행할 수 있으며, 인간과 AI가 상호작용할 수 있는 중요한 요소였다. 민속적 용어 등은 AI가 훈련한 데이터가 편향되거나 다양성이 부족한 경우 과소 대표되거나 고정관념이 반영된 이미지가 생성되는 등, AI 에이전트가 글로벌 패션 문화에 대한 통합적인 이해를 가지고 있다고 판단하기는 어려웠다. 그리고 대부분의 AI 에이전트들이 사용자 친화적인 인터페이스로 전문가뿐만 아니라 비전문가들도 쉽게 사실적이고 매력적인 패션 디자인을 생성할 수 있는 특징이 있었지만, 패션 이미지 제시만이 아니라 개념을 명확하게 시각화하고 실제화할 수 있는 패션 이미지를 창출하기 위해서는 반복적인 훈련을 통한 정확한 프롬프트 설계 및 큐레이션과 같은 인간과 AI가 상호작용하여 공동창조에 참여할 수 있는 능력을 배양할 필요가 있는 것으로 나타났다.


Ⅴ. 결론

본 연구는 패션 디자인에서 AI가 창의적 패션 디자인 도출에 기여할 수 있는 공동 창작 에이전트로서 역할 할 수 있는지 확인하기 위해서 패션 이미지를 실질적으로 생성·평가해보고 HAIC를 통한 패션 디자인 생성을 위해 활용할 수 있는 적합한 AI 에이전트를 도출하였다. 본 연구의 결과를 요약하면 다음과 같다.

분석 결과, 동일한 개념의 프롬프트에도 AI 에이전트에 따라, 다른 무드, 실루엣, 디테일의 배치와 활용이 나타날 수 있고, 같은 AI 에이전트에 매번 동일한 프롬프트, 초기 지침, 변수 설정을 입력하더라도 다른 조형성을 지닌 패션이 내포된 이미지들이 생성되며 7개의 AI 에이전트 가운데 아트브리더와 미드저니가 창의적 패션 디자인 생성을 위한 HAIC의 협업 에이전트로서 적합한 특징을 지니고 있음을 알 수 있었다. 그리고 민속적인 개념의 패션 이미지의 경우 창의성이 낮게 평가되는 등 HAIC를 통한 패션 이미지에 있어서 프롬프트 내용 및 성격에 따라 다른 창의성이 나타날 수 있지만 대체적으로 정교성이나 참신성, 심미성은 우수한 것으로 나타났다. 그리고 AI의 이미지합성, 인페이팅, 아웃페인팅 기능 등을 통해 생성된 패션 이미지는 AI가 정교하고 빠르게 패션 디자인을 부분적으로 수정하고 변형하는 것과 의외의 새로운 패션 디자인 요소를 창출하는 것이 가능함을 보여주며, 인간 디자이너로 하여금 AI를 통제하고 디자인하는 과정에서 상호작용하는 느낌을 지닐 수 있게 하였다. 그러나 그 과정에 있어서 패션 또는 인체 이미지 왜곡이나 불완전성을 수반하는 경우가 있어 인간이 완전한 제어권을 가지기에는 부족함을 느낄 수 있으며, 복잡하거나 민속적인 개념의 경우 더욱 그러한 경향이 있음을 알 수 있었다. 특히, 민속적 용어 등은 AI를 위한 훈련 데이터가 편향되거나 다양성이 부족한 경우 과소 대표되거나 고정관념이 반영된 이미지가 생성되었다. 그리고 대부분의 AI 에이전트들이 사용자 친화적인 인터페이스로 설계되어 있지만 이를 효과적으로 사용하는 방법을 배우는 데는 반복적인 학습이 필요했다. 이러한 한계에도 불구하고 AI 에이전트들은 창의적인 패션 디자인 프로세스를 간소화하고 다양한 스타일을 빠르게 실험하며, 시각적 콘텐츠의 품질을 향상하길 원하는 디자이너들에게 유용한 도구가 될 수 있음을 확인할 수 있었다.

이처럼, 이미지를 생성하는 AI는 창작자의 인센티브 구조를 크게 변화시키고 비즈니스와 사회에 대한 위험을 높일 수 있다. 특히 값싸게 만들어진 저질의 AI 콘텐츠가 인간 콘텐츠를 약화시킨다면, 인간의 창의 능력과 의지는 위축되고 그에 따라 혁신이 둔화될 것이다. 반면 고품질의 AI 생성물은 창의성을 비롯해 혁신성, 지속가능성, 개인화, 민주화 등의 가치를 창출할 수 있는 솔루션을 제공할 수 있다. 이렇듯, AI 생성 콘텐츠의 품질을 높이기 위해서는 인간과 AI 상호 간의 피드백과 개선의 지속적이고 반복적인 조정, AI의 컴퓨팅프로세스와 인간의 중요한 의사 결정, 윤리적 판단의 융합이 요구된다. 인간은 AI 에이전트의 훈련 및 조정에 참여하고 불일치, 오류 및 편견을 제거, 개선과 최적화를 위해 상호 작용해야 한다. 구체적으로 AI에 주입하는 데이터의 품질 관리와 주류와 비주류 문화 데이터의 양적 균형을 맞추는 인간의 노력으로 AI가 민속적이거나 추상, 복합적 용어를 바르게 인식하고 포괄적이면서 편견이 완화된 생성물을 도출할 수 있어야 한다. 또한, AI 에이전트가 사용자 입장에서 텍스트를 얼마나 상세하게 작성해야 하는지, 어떻게 표현해야 더 효과적인 결과물을 생성할 수 있는지에 대해 자세히 제시하고 베리에이션 과정에서 이미지 간의 연관성을 수치로 조절할 수 기능을 제공하는 등, 인간디자이너의 선호에 맞게 이미지를 변경할 수 있는 장치들이 필요하다. 즉, 창의적인 패션 이미지를 도출하기 위해서는 HAIC에 참여하는 AI 에이전트의 편견을 완화하고 공정성과 정확성을 배양할 수 있는 지속적인 개선과 다양한 사용자 기반 서비스가 요구되며, 인간이 창의성과 개방성, 경험적 지식을 토대로 AI가 생성한 이미지들을 판단하고 개입할 수 있는 신중하게 설계된 거버넌스 프레임워크가 필요함을 알 수 있었다.

본 연구는 AI 에이전트 일부만을 대상으로 연구 책임자에 의해 수행된 프로젝트 생성물에 대한 평가를 진행한 것으로 주관적인 분석 및 평가의 여지가 있어 이를 일반화하기에는 무리가 있을 수 있다. 그러나 HAIC를 통해 생성된 패션 이미지의 창의성과 AI 특성을 패션 전문가 집단이 실재적으로 평가함으로써 창의적 패션 디자인 생성을 위해 활용될 수 있는 AI 에이전트를 도출할 수 있었다는데 연구의 의의가 있다. 연구의 결과는 창의적인 패션 디자인을 위한 최적화된 AI 에이전트 설계를 위한 연구의 기초자료로 활용될 수 있으며, 향후 HAIC를 통한 창의적인 패션 아이디어 산출 및 새로운 비즈니스 모델 등 전략적 패션 디자인 개발, 패션 시장에서의 경쟁력 강화를 위한 AI 기반 창의 플랫폼 구축 등에 기여할 수 있을 것으로 사료된다. 따라서 후속 연구에서는 본 연구결과 HAIC를 위한 협업 에이전트로서 우수하다고 평가된 아트브리더와 미드저니를 활용해서 패션 전공생들이 HAIC를 시도하고 생성된 패션 이미지 및 디자인에 대한 전문가 평가와 사용성평가 등을 실시함으로써 창의적 패션 디자인을 위해서는 AI에 있어서 어떤 시스템적 특성에 관심을 기울여야 하는가를 규명하고 이를 실질적으로 구현하는 방법을 모색해 보고자 한다.

Acknowledgments

이 논문은 2022년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2022S1A5B5A16051678).

References

  • Amabile, T. M. (1982). Social psychology of creativity: A consensual assessment technique. Journal of Personality and Social Psychology, 43(5), 997–1013. [https://doi.org/10.1037/0022-3514.43.5.997]
  • An, H. & Park, M. (2021). A case study on an artificial intelligence fashion curation practice subject through industrial-academic project-based learning. Fashion & Textile Research Journal, 23(3), 337–346. [https://doi.org/10.5805/sfti.2021.23.3.337]
  • An, H., Kwon, S., & Park, M. (2019). A case study on the recommendation services for customized fashion styles based on artificial intelligence. Journal of the Korean Society of Clothing and Textiles, 43(3), 349-360. [https://doi.org/10.5850/jksct.2019.43.3.349]
  • Atkins, D. (2023, September 11). Top 10 AI art generators to harness creativity. Influencer Marketing Hub. Re trieved from https://influencermarketinghub.com/ai-art-generators
  • Besemer, S. P. & O'Quin, K. (1999). Confirming the three-factor creative product analysis matrix model in an American sample. Creativity Research Journal, 12(4), 287-296. [https://doi.org/10.1207/s15326934crj1204_6]
  • Chung, K. & Lee, M. (2023). A case study of human-AI co-creation(HAIC) in fashion design. Journal of Fashion Business, 27(4), 141–162. [https://doi.org/10.12940/JFB.2023.27.4.141]
  • Cui, M., Kim, M., Choi, S., & Lee, S. (2022). The usage and impact of GAN in graphic design. Archives of Design Research, 35(4), 285-307. [https://doi.org/10.15187/adr.2022.11.35.4.285]
  • DALLE-2 - Features, Pricing & Use Cases, Toolsforhu mans (2023, October 26). Retrieved from https://www.toolsforhumans.ai/ai-tools/dalle-2
  • DeNinno, N. (2023, April 20). First-ever AI fashion week debuts in NYC: ‘A new realm of creation’. NYPOST, Retrieved from http://nypost.com/2023/04/20/first-ai-fashion-week-coming-to-nyc-new-realm-of-creation
  • Deterding, S., Hook, J., Fiebrink, R., Gillies, M., Gow, J., Akten, M., …Compton, K. (2017). Mixed-initiative creative interfaces. Proceedings of the 2017 CHI Conference Extended Abstracts on Human Factors in Computing Systems (pp. 628–635). New York, USA: Association of Computing Machinery. [https://doi.org/10.1145/3027063.3027072]
  • Guilford, J. P. (1950). Creativity. American Psychologist, 5(9), 444–454. [https://doi.org/10.1037/h0063487]
  • Gwira, C. (2023, October 23). 12 Best AI text-to-image tools in 2023. Elegantthemes. Retrieved from https://www.elegantthemes.com/blog/design/best-ai-text-to-image-tools
  • Haenlein, M. & Kaplan, A. (2019). A brief history of artificial intelligence: On the past, present, and future of artificial intelligence. California Management Review, 61(4), 5-14. [https://doi.org/10.1177/0008125619864925]
  • Jalli, A. (n.d.). 10 Best AI art generators of 2024. Codingem. Retrieved from https://www.codingem.com/best-ai-art-generators
  • Jeffries, K. K. (2015). A CAT with caveats: Is the consensual assessment technique a reliable measure of graphic design creativity?. International Journal of Design Creativity and Innovation, 5(1-2), 16-28. [https://doi.org/10.1080/21650349.2015.1084893]
  • Jeong, W.-J. & Kim, S.-I. (2018). A study on the role of designer in the 4th industrial revolution: Focusing on design process and A.I based design software. Journal of Digital Convergence, 16(8), 279–285. [https://doi.org/10.14400/JDC.2018.16.8.279]
  • Jung, J. R. (2021). Perception of fashion designer’s capability and product quality: AI vs. AI+Human vs. Human (Unpublished master’s thesis). Seoul National University, Seoul, Republic of Korea.
  • Kim, D. W. (2022, December 7). How does AI draw a picture? [AI는 어떻게 그림을 그릴까]. Newstheai. Retrieved from https://www.newstheai.com/news/articleView.html?idxno=3610
  • Kim, H. & Suh, S. (2020). A study on the development of Korean fashion design using the forced-relationship techniques. Journal of Fashion Business, 24(5), 21–34. [https://doi.org/10.12940/JFB.2020.24.5.21]
  • Kim, H. J. & Na, H S. (2015). A case study on the sustainable fashion design. Korean Society of Fashion Design, 15(3), 53-68.
  • Kim, K. H. & Kim, H. G. (2023). A case study of ChatGPT and Midjourney: Exploring the possiblility of use for art and creation using AI. The Treatise on The Plastic Media, 26(2), 1-10. [https://doi.org/10.35280/KOTPM.2023.26.2.1]
  • Kim, Y. & Lee, S. (2004). Developing the Korean version instrument of evaluating creative products and confirmation of its structure. Korean Journal of Industrial and Organizational Psychology, 17(3), 305-327.
  • Ko, A. & Lee, J. (2019). Comparison of creativity evaluations among science teachers, art teachers, scientists and artists on science-art convergence products. The Journal of the Korean Society for Gifted and Talented, 18(1), 101-121. [https://doi.org/10.17839/jksgt.2019.18.1.101]
  • Koushik (2023, November 28). Understanding convolutional neural networks (CNNs) in depth. Medium. Retrie ved from https://medium.com/@koushikkushal95/understanding-convolutional-neural-networks-cnns-in-depth-d18e299bb438
  • Lee, C., Han, J., & Kang, H. (2017). A study of component changes in Han-bok form 2000 to 2015: Based on women`s Han-bok images from internet newspapers. Journal of Communication Design, 60, 348-362.
  • Lee, C.-H. & Lee, J.-H. (2021). The applicability of artificial intelligence based design tools on fashion design thinking. Journal of Korea Design Forum, 26(2), 155-170. [https://doi.org/10.21326/ksdt.2021.26.2.014]
  • Lee, H. & Kim, Y.-W. (2023). Study of improved CNN algorithm for object classification machine learning of simple high resolution image. The Journal of Korea Institute of Information, Electronics, and Communication Technology, 16(1), 41–49. [https://doi.org/10.17661/JKIIECT.2023.16.1.41]
  • Lee, M. & Choi, E. (2023). A study on creative nail art design generation based on text prompt: Focused on image-generating artificial intelligence models, DALL-E 2 and Bing image creator. Journal of the Korean Society of Cosmetology, 29(4), 1058-1065. [https://doi.org/10.52660/JKSC.2023.29.4.1058]
  • Lee, S. & Kang, J. (2023). A study on artificial intelligence-driven paradigm shift in the webtoon ecosystem. The Society of Convergence Knowledge Transactions, 11(3), 45-54.
  • Lee, S., Yun, J., Park, M., Hyung, J., & Choo, J. (2022). Latest trends in text-to-image generation models. Communications of the Korean Institute of Information Scientists and Engineers, 40(12), 21-30.
  • Lee, W. Y. (2020). Fashion design education using deep dream generator in intelligence information society. Journal of the Korean Society Design Culture, 26(2), 429-446. [https://doi.org/10.18208/ksdc.2020.26.2.429]
  • Lee, Y. K. (2022). How complex systems get engaged in fashion design creation: Using artificial intelligence. Thinking Skills and Creativity, 46, 101-137. [https://doi.org/10.1016/j.tsc.2022.101137]
  • Liu, V. & Chilton, L. B. (2022). Design guidelines for prompt engineering text-to-image generative models. Proceedings of the 2022 CHI Conference on Human Factors in Computing Systems (pp. 1–23). LA, USA: Association of Computing Machinery.
  • Lowenfeld, V. (1960). Creative intelligence. Studies in Art Education, 1(2), 22-25. [https://doi.org/10.2307/1319844]
  • McFarland, A. & Tardif, A. (2023, May). 10 Best AI Art Generators 2023. Unite.AI. Retrieved from https://irp.cdn-website.com/44bcd71a/files/uploaded/10-best-ai-art-generators-may-2023-unite-ai_6474bd62.pdf
  • Na, H. B. (2022). A study on the product form development process using generative design (Unpublished doctoral dissertation). Seoul National University of Science and Technology, Seoul, Republic of Korea.
  • Park, C. (2022, April 8). OpenAI develops ‘DALL-E 2’, an AI system that generates text into high-resolution images [오픈AI, 텍스트를 고해상도 이미지로 생성하는 AI 시스템 ‘DALL-E 2’ 개발], AITimes. Retrie ved from https://www.aitimes.com/news/articleView.html?idxno=143854
  • Park, H. N. (2023). A Case Study on Application of Text to Image Generator AI DALLㆍE. The Treatise on The Plastic Media, 26(1), 102-110. [https://doi.org/10.35280/KOTPM.2023.26.1.11]
  • Park, H.-W. (2004). A study on the recognition of Korean image fashion designs by U.K fashion specialists. Journal of Fashion Business, 8(2), 69-90.
  • Pieters, R. & Winiger, S. (2016, March 8). Creative AI: On the democratisation and escalation of creativity, Medium. Retrieved from https://www.medium.com/@creativeai/creativeai-9d4b2346faf3
  • Pranav, P. (2023, March 23). Stable diffusion simplified!. Medium. Retrieved from https://medium.com/@pranav_p_18829/stable-diffusion-simplified-36b6ca37f51c
  • Rezwana, J. & Maher, M. L. (2022). Designing creative AI partners with COFI: A framework for modeling interaction in human-AI co-creative systems. ACM Transactions on Computer-Human Interaction, 30(5), 1-28. [https://doi.org/10.1145/3519026]
  • Rhodes, M. (1961). An analysis of creativity. The Phi Delta Kappan, 42(7), 305-310.
  • Seo, H. A. & Kim. H. (2006). The effects of music listening activities which Apply animation on the development of creativity in children. The Journal of Korea Open Association for Early Childhood Education, 11(2), 113-131.
  • Shaikh, E. (2023, October 8). 17 Best AI Image Generators of 2023. Demandsage, Retrieved from https://www.demandsage.com/ai-image-generators
  • Shin, J. (2019). Artificial intelligence and big data in visual art. The Korean Journal of Arts Studies, (25), 65-89. [https://doi.org/10.20976/kjas.2019..25.004]
  • Song, Y. E. (2018). A study on the test model development for design creativity evaluation and its application. A Journal of Brand Design Association of Korea, 16(2), 117-134.
  • Song, Y. E. & Park, K. W. (2014). Study of ways to evaluate infants' creativity using three dimensional model design: Basic study of developing design creativity evaluation indicator. A Journal of Brand Design Association of Korea, 12(4), 167-180.
  • Taylor, C. W. (1988). Various approaches to and definitions of creativity. In R. J. Sternberg (Ed.), The nature of creativity: Contemporary psychological perspectives (pp. 99–121). Cambridge, UK: Cambridge University Press.
  • Thomas, J. C. & Carroll, J. M. (1979). The psychological study of design. Design Studies, 1(1), 5-11. [https://doi.org/10.1016/0142-694X(79)90020-6]
  • Torrance, E. P. (1972). Can we teach children to think creatively? Journal of Creative Behavior, 6(1), 114-143. [https://doi.org/10.1002/j.2162-6057.1972.tb00923.x]
  • Wi, S. & Jung, J (2021). Development of fashion design with sustainable design elements. Korean Society of Fashion Design, 21(3), 105-118. [https://doi.org/10.18652/2021.21.3.7]
  • Wu, Z., Ji, D., Yu, K., Zeng, X., Wu, D., & Shidujaman, M. (2021). AI creativity and the human-AI co-creation model. In M. Kurosu (Ed.), Proceedings of the 2021 HCI International Conference (pp. 171-190). Virtual Event. Springer. [https://doi.org/10.1007/978-3-030-78462-1_13]
  • Yang, L., Zhang, Z., Song, Y., Hong, S., Xu, R., Zhao, Y., …Yang, M. (2023). Diffusion models: A comprehensive survey of methods and applications. ACM Computing Surveys, 56(4), 1-39. [https://doi.org/10.1145/3626235]
  • Yeon, J. & Park, J. (2020). A study on sustainable fashion design: Using the design method of RE; CODE. Korean Society of Fashion Design, 20(3), 107-125. [https://doi.org/10.18652/2020.20.3.7]
  • Yin, Y., Han, J., Huang, S., Zuo, H., & Childs, P. (2021). A study on student: Assessing four creativity assessment methods in product design. Proceedings of the 2021 International Conference on Engineering Design (pp. 263-272). [https://doi.org/10.1017/pds.2021.27]
  • Yoon, H. N. (2023, June 19). Digital innovation how fashion companies utilize ‘AI’ 4. [패션 기업이 ‘AI’를 활용하는 방법 4]. Dito, Retrieved from https://dito.fashion/DigitalInnovation/?idx=15470538&bmode=view
  • Zeng, Z., Sun, X., & Liao, X. (2019). Artificial intelligence augments design creativity: A typeface family design experiment. In A. Marcus & W. Wang (Eds.), Proceedings of the 2021 HCI International Conference. Design, User Experience, and Usability: User Experience in Advanced Technological Environments (pp. 400-411). Florida, USA : Springer. [https://doi.org/10.1007/978-3-030-23541-3_29]
  • Zhou, K., Yang, J., Loy, C., & Liu, Z. (2022). Learning to prompt for vision-language models. International Journal of Computer Vision, 130, 2337–2348. [https://doi.org/10.1007/s11263-022-01653-1]

<Fig. 1>

<Fig. 1>
The General Structure of CNNs(Koushik, 2023)

<Fig. 2>

<Fig. 2>
Architecture of DM(left) and LDM(right)(Pranav, 2023)

<Fig. 3>

<Fig. 3>
Research Process

<Table 1>

AI Image Generator Rated as Excellent on AI Evaluation Site

influencermarketinghub.com www.unite.ai www.elegantthemes.com www.codingem.com www.demandsage.com
(Atkins, 2023; Gwira, 2023; Jalli, n.d.; McFarland, & Tardif, 2023; Shaikh, 2023)
1 Jasper GetIMG PhotoSonic LimeWire Jasper
2 NightCafe NightCafe Jasper Nightcafe Midjourney
3 Starry AI Shutterstock Midjourney Stable Diffusion DALL-E 2
4 OpenArt DALL-E 2 DALL-E 2 DALL-E 2 Starry AI
5 Cutout.pro Deep Dream Generator NightCafe Midjourney Dream by Wombo
6 Artbreeder Artbreeder Bing Image Creator Fotor Nightcafe
7 Artimator Stablecog Dream by Wombo Deep Dream Generator Synthesys X
8 GetIMG DeepAI Divi AI Artbreeder Pixray
9 ImagineMe Starry AI Shutterstock Starry AI Deep Dream Generator
10 BlueWillow CFSpark Picsart RunwayML Deep AI

<Table 2>

AI Image Generator’s Characteristics

AI Agent Best Usage Mechanics Text-to-image Image-to-image Easy Style option High resolution Image variants Image blending In-painting Out-painting
Artbreeder Improving Image Quality BigGAN/Style GAN
DALL-E 2 Photo Realistic Images DM × ×
Deep Dream Generator Multiple Art Styles CNN × ×
Jasper Well-rounded Platform DM × × ×
Midjourney High-Quality Images SD
Night Cafe Easy Access DALL-E 2, SDM, CLIP-guided DM, VQGAN+CLIP × ×
StarryAI Generating NFTs for Free SD × ×

<Table 3>

Prompt Derivation Process for Fashion Design Creation

Prompts Sustainable Fashion 24 S/S Trend Korean Fashion
Keywords Research or Magazine Kim & Na(2015) : Redesign, Vintage, Organic, Vegan, Convertable, Reduce, Ethical Slogan Vogue : Diaphanous White Dresses, Black, Open-Work Materials, Slashes and Shreds, Aprons, Sculptural Volumes, The Elongated Silhouette, Metallics, Polo Shirts, Roses, Feathery Touches Park(2004) : Hanbok Style, Asymmetrical, Traditional Materials or Natural Dyeing, Decorative & Sewing Techniques (embroidery, knots, patchwork, quilting)
Wi & Jung(2021) : Long-lasting Design, Zero Waste, Convertable Renewable Functional Wmagazine : 1960s Mini Hems, ’90s Nostalgia, Business Casual, Butter- hued, Denim Dandy, Noir, Knit,Layered, Fringe, Extreme Proportions, Sporty Chic, Enlarged Silhouette, Traveling Wardrobe, Tumble Dry, Futuristic Kim & Suh(2020) : Hanbok Style. Color, Material, Pattern, Ornament, & Decoration Technique, Art (landscape & folk), Traditional Korean Objects (Hangul, Jogakbo, Hanok, Dancheong)
Chatgpt 4 Environmentally Friendly Materials, Ethical and Fair Labor Practices, Reducing Waste, Circular Design, Local & Sustainable Production, Long-lasting Design, Transparency No-result Hanbok Silhouette, Vibrant Colors, Embroidery & Decorations, Fabric : silk or other high-quality fabrics. Po, Dangui, Gat, Norigae Modern/Casual Hanbok
Result Eco-Friendly Materials, Zero Waste, Long-lasting Design, Convertable, Redesign, Ethical Slogan Silhouette : Sculptural Volumes, Layered, Sporty, Elongated Hanbok, Asymmetrical, Embroidery & Decorations (embroidery, knots, patchwork, quilting), traditional materials or natural dyeing, Korean Objects (Hangul, Jogakbo, Hanok)
Color : White, Black, Butter-ued
Material : Metallic, Open-Work, Feathery/Fringe, Knit, Roses, Denim
Derive Prompts from Keywords
“Zero-waste fashion design featuring a full-body hyper-realistic image of a woman with a 10-head proportion, wearing a sporty coat with sculptural voluminous sleeves in white made of open-work material, a metallic-colored layered slash top, and a convertible skirt." ‥ “Zero waste fashion design using recycled plastic. A surreal-photo image of a woman wearing a sporty coat with white sculptural volume sleeves made of openwork material, a metallic-colored layered slash top, and a convertible skirt.”

“A full-body photo features a woman with a 10-head proportion, wearing a Hanbok dress. The dress has a voluminous and elongated silhouette made of black silk with metallic oriental brushwork patterns. Additionally, it showcases three-dimensional decorations such as feathers and rose details on the sleeves and skirt." ‥
“A full- length photo image of a tall woman wearing modern slim pants and a voluminous, elongated Hanbok Jeogori made of black silk with a metallic oriental brushstroke pattern and three-dimensional decorations such as feathers and rose details on the sleeves.”

<Table 4>

Mood Board through HAIC

Task Artbreeder DALL-E 2 Deep Dream Generator Jasper Midjourney NightCafe StarryAI
Task 1
Task 2

<Table 5>

Fashion Images through HAIC

AI Agent Task 1 : Sustainable Fashion Task 2 : Korean Image Fashion
Artbreeder
DALL-E 2
Deep Dream Generator
Jasper
Midjourney
NightCafe
StarryAI

<Table 6>

Reflection of Design Depiction in Generated Fashion Designs○ : satisfied, △ : Insufficient × : unsatisfied

AI Agent Task 1 : Sustainable Fashion Task 2 : Korean Fashion
Form Color Material Form Color Material
sporty coat sculptural voluminous sleeves layered slash top conver tible skirt white metallic recycled plastic open work Hanbok Jeogori slim pants voluminous elongated three-dimensional de corations feather & rose details black silk metallic oriental brush work
Artbreeder × × × × × × ×
DALL-E 2 × ×
DeepDream Generator × × × × × × × × × ×
Jasper × × ×
Midjourney × × ×
NightCafe × × ×
Starry AI × ×

<Table 7>

Creativity Evaluation of Fashion Iages through HAIC Mean Value

AI Agent Novelty Technicity Elaboration Aesthetics
Sustainable Korean Total Sustainable Korean Total Sustainable Korean Total Sustainable Korean Total
Artbreeder 5.13 4.00 4.56 4.00 3.88 3.94 3.75 4.56 5.13 3.50 4.31
DALL-E 2 5.13 2.50 3.81 4.00 3.88 3.94 4.00 3.25 3.63 4.38 3.00 3.69
Deep Dream Generator 3.38 3.25 3.31 3.63 2.88 3.25 4.50 4.25 4.38 4.63 3.38 4.00
Jasper 4.88 3.88 4.38 4.25 4.25 4.25 5.13 4.25 4.69 4.75 3.63 4.19
Midjourney 5.38 4.88 5.13 4.25 3.63 3.94 5.50 5.00 5.25 4.75 5.38 5.06
NightCafe 5.13 2.63 3.88 3.50 3.50 3.50 5.38 3.88 4.63 5.00 2.88 3.94
Starry AI 4.88 3.75 4.31 3.75 3.88 3.81 5.13 4.38 4.75 4.63 3.63 4.13

<Table 8>

Fashion Images Variation by Human Curation

Seed Fashion Images from AI Fashion Image Variation
Image Variants Image Blending In-painting Out-painting ETC
Artbreeder
Poser: Pose+Image+Prompt
DALL-E 2
-
Deep Dream Generator
- - -
Jasper
- - - -
MidJourney
-
NightCafe
- - -
StarryAI
- - -

<Table 9>

Features of AI Agents on Fashion Image Creation○ : satisfied, △ : Insufficient × : unsatisfied

AI Agent Text Understanding & Expression Variation Human Curation HAIC possibility
Fashion Model Background
Form Color Material
Artbreeder ㆍHigh correlation between designs
ㆍCan be modified depending on parameters and options
Satisfactory level
ㆍImage blending, In-painting, Collage, Out-panting, Poser, Tuner(genetic)
ㆍMost diverse and detailed curation functions
High level of interaction
ㆍReflects mid-level design elements
ㆍVaries depending on topic
ㆍContains an element of surprise and aesthetic appeal
Creative suggestions
High HAIC possibility
ㆍRelatively good understanding of general forms and colors
ㆍStructural form expression
ㆍLow understanding of folk costumes terminology
ㆍLack of realistic and detailed description (item composition, detail elements, materials)
ㆍDistortion of the human body and face
ㆍNatural shading expression
DALL-E 2 ㆍLow correlation between designs
ㆍModification not possible depending on parameter and options
Unsatisfactory
ㆍImage blending, In-painting, Out-painting
ㆍInsufficient options for design convertsion
ㆍImperfection of products through curation
Low level of interaction
ㆍReflects high-level design elements
ㆍVaries depending on topic
ㆍLow novelty, elaboration, and aesthetics
ㆍOrdinary creativity
Lower middle HAIC possibility
ㆍRelatively good understanding of general forms and colors
ㆍLack of realistic and detailed description (item composition, detail elements, materials)
ㆍLow resolution makes it difficult to understand what exactly the image means. High abstraction
ㆍDistortion of the human body and face
ㆍUnrealistic shading
Deep Dream Generator × ㆍIntermediate correlation between designs
ㆍModification not possible depending on parameter and options
Unsatisfactory
ㆍIn-painting, Editing
ㆍInsufficient options for design conversion
ㆍLow deformability through passive curation
Low level of interaction
ㆍReflects low-level design elements
ㆍVaries depending on topic
ㆍContains no unexpected elements
ㆍOrdinary creativity
Create realistic and practical fashion images
Low HAIC possibility
ㆍRelatively low understanding of general forms
ㆍLow understanding of folk costumes terminology
ㆍReal photo feel
ㆍExpression of simple formative characteristics
ㆍIntermediate understanding and description of colors and materials
ㆍNatural shading expression
Jasper ㆍHigh correlation between designs
ㆍCan be modified depending on parameters and options
Satisfactory level
ㆍProvides initial options when creating(art style, mood, medium)
ㆍNo image transformation function
Low level of interaction
ㆍReflects high-level design elements
ㆍVaries depending on topic
ㆍOverall excellent creativity
Creative suggestions
Medium HAIC possibility
ㆍRelatively good understanding of general forms, colors, and materials
ㆍLow understanding of folk costumes terminology
ㆍReal photo feel
ㆍRealistic and detailed explanations possible (item composition, detail elements, materials, color, and human)
ㆍNatural shading expression
Midjourney ㆍHigh correlation between designs
ㆍCan be modified depending on parameters and options
Satisfactory level
ㆍImage blending, In-painting, Out-painting
ㆍDetailed curation functions
ㆍRequires repeated attempts and learning about the interface
High level of interaction
ㆍReflects mid-level design elements
ㆍVaries depending on topic
ㆍContains an element of surprise
Creative suggestions
Create realistic fashion images
High HAIC possibility
ㆍRelatively good understanding of general forms, colors, and materials
ㆍLow understanding of folk costumes terminology
ㆍReal photo feel
ㆍDynamic combination of details and materials
ㆍRealistic and detailed explanations possible (item composition, detail elements, materials, color, and human)
ㆍNatural shading expression
NightCafe ㆍHigh correlation between designs
ㆍCan be modified depending on parameters and options
Satisfactory level
ㆍIn-painting
ㆍInsufficient options for design conversion
ㆍDesign fluency through curation
Medium level of interaction
ㆍReflects mid-level design elements
Varies depending on topic
Creative suggestions
Create realistic and practical fashion images
Medium HAIC possibility
ㆍRelatively good understanding of general forms and colors
ㆍLow understanding of folk costumes terminology
ㆍReal photo feel
ㆍRealistic and detailed explanations possible (item composition, detail elements, materials, color, and human)
ㆍNatural shading expression
Starry AI ㆍHigh correlation between designs
ㆍCan be modified depending on parameters and options
Satisfactory level
ㆍIn-painting
ㆍInsufficient options for design conversion
ㆍImperfection of products throughcuration
Low level of interaction
ㆍReflects high-level design elements
ㆍVaries depending on topic
Contains an element of surprise
Creative suggestions
Medium HAIC possibility
ㆍRelatively good understanding of general forms and colors
ㆍStructural form expression
ㆍLow understanding of folk costumes terminology
ㆍLack of realistic and detailed description (item composition, detail elements, materials)
ㆍDistortion of the human body and face
ㆍNatural shading expression