ເບິ່ງຮູບແບບໃຫມ່ Al Generative Art

Al Generative Art ແມ່ນປະເພດຂອງສິລະປະ, ໃນກໍລະນີຫຼາຍທີ່ສຸດ, ແມ່ນອີງໃສ່ການຮ່ວມມືລະຫວ່າງມະນຸດແລະລະບົບເອກະລາດ. "ລະບົບປົກຄອງຕົນເອງ" ຖືກກໍານົດວ່າເປັນ ປັນຍາປະດິດ ຊອບແວ, algorithm ຫຼືຕົວແບບທີ່ມີຄວາມສາມາດປະຕິບັດການດໍາເນີນງານທີ່ສັບສົນໂດຍບໍ່ຈໍາເປັນຕ້ອງມີການແຊກແຊງຂອງໂປລແກລມ.

ຈາກ juxtapositions bizarre ຂອງຮູບພາບທີ່ສ້າງຂຶ້ນໂດຍ Dall-E Mini ການ NFT ຕະຫຼາດ, ຮູບພາບທີ່ຜະລິດໂດຍ AI algorithms ກໍາລັງເຂົ້າສູ່ຈິນຕະນາການຕົ້ນຕໍ. ໃນຄວາມເປັນຈິງ, ສອງໂຄງການທີ່ສໍາຄັນກ່ຽວກັບວິຊາທີ່ສົມຄວນໄດ້ຮັບການວິເຄາະແມ່ນ: ກາງແຈ້ງ ແລະ DALL-E2.

ແນ່ນອນ, ຂ່າວຍັງເຮັດໃຫ້ວິທີການຂອງຕົນໄປສູ່ Twitter. ຄໍາເຫັນກ່ຽວກັບມັນ, ແລະອື່ນໆ, ແມ່ນ Charles Hoskinson, ຜູ້ທີ່ຂຽນວ່າ:

AI ສ້າງສິລະປະ. ຂ້ອຍສາມາດສ້າງຮູບນີ້ໃນເວລາພຽງສອງສາມນາທີ. ຂ້າພະເຈົ້າບໍ່ສາມາດຈິນຕະນາການວິທີການທີ່ຫນ້າສັງເກດເຕັກໂນໂລຊີນີ້ຈະເປັນໃນ 3 ປີ pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) ກຸມພາ 1, 2023

Al Generative Art: ການທົດລອງຕົ້ນແລະລັກສະນະ

ໂດຍເຂົ້າໃຈສິ່ງທີ່ Generative Art ແມ່ນຫຍັງ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະເນັ້ນຫນັກໃສ່ຫນຶ່ງໃນຫຼັກການພື້ນຖານຂອງມັນ: ຄວາມສຸ່ມ. ເຊິ່ງເປັນຊັບສິນພື້ນຖານຂອງສິລະປະທົ່ວໄປ.

ໃນຄວາມເປັນຈິງ, ອີງຕາມປະເພດຂອງຊອບແວ, ລະບົບປົກຄອງຕົນເອງສາມາດປະມວນຜົນຜົນໄດ້ຮັບທີ່ແຕກຕ່າງກັນແລະເປັນເອກະລັກໃນແຕ່ລະເວລາທີ່ຄໍາສັ່ງສ້າງ, ຫຼືມັນສາມາດສົ່ງຜົນໄດ້ຮັບຈໍານວນການປ່ຽນແປງເພື່ອຕອບສະຫນອງການປ້ອນຂໍ້ມູນຂອງຜູ້ໃຊ້.

ການທົດລອງຄັ້ງທໍາອິດໃນ Generative Art ມີວັນທີກັບຄືນໄປບ່ອນ 1960s ກັບການທົດລອງຂອງ Harold Cohen ແລະລາວ ອາໂຣນ ໂຄງການ. ທໍາອິດ Cohen ໄດ້ໃຊ້ຊອບແວແບບຢືນຢູ່ຄົນດຽວເພື່ອສ້າງງານສິລະປະທີ່ບໍ່ມີຕົວຕົນທີ່ໄດ້ຮັບແຮງບັນດານໃຈໂດຍ Pop Art silkscreens. ປະຈຸບັນ, ວຽກງານຂອງ Cohen ໄດ້ຖືກສະແດງຢູ່ຫໍວາງສະແດງ Tate ໃນລອນດອນ.

ຄຸນລັກສະນະອື່ນຂອງ Generative Art, ແຕ່ຫນຶ່ງທີ່ຫນ້ອຍແລະຫນ້ອຍ prerogative, ແມ່ນການຊໍ້າຄືນຂອງຮູບແບບຫຼືອົງປະກອບທີ່ບໍ່ມີຕົວຕົນສະຫນອງໃຫ້ໂດຍ programmer ແລະປະຕິບັດພາຍໃນລະຫັດຊອບແວ.

ນອກຈາກນັ້ນ, ການພັດທະນາຂອງເຄືອຂ່າຍ neural ສະລັບສັບຊ້ອນທີ່ເພີ່ມຂຶ້ນທີ່ດໍາເນີນການກ່ຽວກັບການເຊື່ອມໂຍງຂໍ້ຄວາມ - ຮູບພາບໄດ້ຊ່ວຍໃຫ້ການພັດທະນາແບບຈໍາລອງທີ່ມີຄວາມສາມາດໃນການສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຖືກຕ້ອງຫຼາຍຂຶ້ນ. ຕົວຢ່າງທີ່ຮູ້ຈັກດີທີ່ສຸດຂອງປະເພດສິລະປະທົ່ວໄປນີ້ແມ່ນ ດາລ-ອີ.

Dall-E ແມ່ນເຄືອຂ່າຍ neural multimodal ໂດຍອີງໃສ່ GPT-3 ຮູບແບບການຮຽນຮູ້ເລິກຈາກ OpenAI, ບໍລິສັດດຽວກັນທີ່ຍັງພັດທະນາບໍ່ດົນມານີ້ ສົນທະນາ GPT, chatbot ເປີດຕົວໃນເດືອນພະຈິກ 2022 ແລະ optimized ກັບ "ຄວບຄຸມ" ແລະເຕັກນິກການຮຽນຮູ້ເສີມ.

ກັບຄືນໄປຫາ Dall-E, ພວກເຮົາເຫັນວ່າລະບົບນີ້ມີຄວາມສາມາດສ້າງຮູບພາບຈາກຄໍາອະທິບາຍຂໍ້ຄວາມ, ເອີ້ນວ່າ a. "ກະຕຸ້ນ," ອີງໃສ່ຊຸດຂໍ້ມູນຂອງຄູ່ຂໍ້ຄວາມ-ຮູບພາບ.

ຮຸ່ນທໍາອິດຂອງ Dall-E, ເຊິ່ງໄດ້ຖືກນໍາສະເຫນີຕໍ່ສາທາລະນະໃນເດືອນມັງກອນ 2021 ແລະຍັງຄົງເປັນສິດທິພິເສດຂອງຜູ້ຊ່ຽວຊານໃນພາກສະຫນາມຈໍານວນຫນ້ອຍ, ເປັນຕົວແທນຂອງການປະຕິວັດທີ່ແທ້ຈິງໃນປະເພດຂອງຮູບແບບການຜະລິດນີ້, ລື່ນກາຍການປະດິດສ້າງຂອງ GPT-. 3 ຕົວຂອງມັນເອງ.

ນອກຈາກນີ້ຍັງມີຄວາມສໍາຄັນແມ່ນຄວາມຈິງທີ່ວ່າຄວາມຖືກຕ້ອງຂອງຜົນໄດ້ຮັບທີ່ດໍາເນີນການໂດຍ Dall-E ພິສູດວ່າເປັນຂອບເຂດທີ່ສົມບູນແບບສໍາລັບການແກ້ໄຂ OpenAI ອື່ນ: ຄລິບ (Contrastive Language-Image Pre-training).

ການຈັດປະເພດຮູບພາບແລະການຈັດອັນດັບເຄືອຂ່າຍ neural ທີ່ໄດ້ຮັບການຝຶກອົບຮົມບົນພື້ນຖານຂອງສະມາຄົມຂໍ້ຄວາມຮູບພາບ, ເຊັ່ນ: ຄໍາບັນຍາຍທີ່ພົບເຫັນຢູ່ໃນອິນເຕີເນັດ. ຂໍຂອບໃຈກັບການແຊກແຊງຂອງ CLIP, ເຊິ່ງເຮັດໃຫ້ຈໍານວນຜົນໄດ້ຮັບທີ່ສະເຫນີຕໍ່ຜູ້ໃຊ້ຕໍ່ການກະຕຸ້ນເຕືອນເຖິງ 32, Dall-E ໄດ້ຖືກພົບເຫັນວ່າສົ່ງຄືນຮູບພາບທີ່ຫນ້າພໍໃຈໃນກໍລະນີຫຼາຍທີ່ສຸດ.

Midjourney: ການອອກແບບ, ໂຄງສ້າງພື້ນຖານຂອງມະນຸດ, ແລະປັນຍາປະດິດ

ຕາມທີ່ຄາດໄວ້, ກາງແຈ້ງ ເປັນໂຄງການທີ່ສໍາຄັນທີ່ເປັນສ່ວນຫນຶ່ງຂອງແນວຄວາມຄິດສິລະປະ Al Generative ທີ່ພົ້ນເດັ່ນຂື້ນ. ໂດຍສະເພາະ, Midjourney ແມ່ນຫ້ອງທົດລອງການຄົ້ນຄວ້າເອກະລາດທີ່ຄົ້ນຫາວິທີການຄິດໃຫມ່ແລະຂະຫຍາຍອໍານາດຈິນຕະນາການຂອງຊະນິດຂອງມະນຸດ.

ການນໍາໃຊ້ມັນແມ່ນງ່າຍດາຍ: ທໍາອິດບັນຊີຕ້ອງໄດ້ຮັບການສ້າງຕັ້ງຂຶ້ນໃນ Discord, ເປັນເວທີທີ່ເປັນເຈົ້າພາບຊຸມຊົນຕ່າງໆ, ບ່ອນທີ່ Midjourney ແມ່ນຫນຶ່ງໃນພວກເຂົາ. ພາຍໃນຄໍາຮ້ອງສະຫມັກແມ່ນຫ້ອງສົນທະນາຕ່າງໆເຊິ່ງບຸກຄົນໃດຫນຶ່ງສາມາດເຂົ້າຮ່ວມຢ່າງຈິງຈັງຫຼືບໍ່ໃນການສົນທະນາ.

ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະຊີ້ໃຫ້ເຫັນວ່າເພື່ອພະຍາຍາມໃຊ້ Artificial Intelligence ເປັນຄັ້ງທໍາອິດຫນຶ່ງຕ້ອງໄປຫາ "ມືໃຫມ່" ຊ່ອງທາງ, ບ່ອນທີ່ 25 ການສະແດງຟຣີ ມີຢູ່.

ການສະແດງຜົນອັນໜຶ່ງກົງກັບການສ້າງສີ່ຕົວແປທີ່ແຕກຕ່າງກັນທີ່ສ້າງຂຶ້ນຈາກການປ້ອນຂໍ້ຄວາມດຽວກັນ.

ດັ່ງນັ້ນ, 25 renders ຫມາຍເຖິງ 25 ວຽກປຸງແຕ່ງທີ່ປະຕິບັດໂດຍ Midjourney bot. ດັ່ງນັ້ນ, ການສ້າງຮູບພາບຮຽກຮ້ອງໃຫ້ມີການພົວພັນກັບ Midjourney bot ຜ່ານຂໍ້ຄວາມທີ່ເອີ້ນວ່າ "ກະຕຸ້ນ", ເຊິ່ງໃນນັ້ນຈະມີຄໍາທີ່ອະທິບາຍເຖິງຮູບພາບທີ່ຜູ້ໃຊ້ມີຢູ່ໃນໃຈ.

ທ່ານສາມາດເພີ່ມລາຍລະອຽດຫຼາຍເທົ່າທີ່ທ່ານຕ້ອງການ, ສິ່ງທີ່ສໍາຄັນແມ່ນການແບ່ງຄໍາສໍາຄັນດ້ວຍເຄື່ອງໝາຍຈຸດ. ເມື່ອການ rendering ສໍາເລັດ, ຄອມພິວເຕີຈະສົ່ງຄືນສີ່ຮູບທີ່ແຕກຕ່າງກັນໂດຍອີງໃສ່ຄໍາອະທິບາຍທີ່ຈະເລືອກເອົາຈາກ.

ນອກຈາກນັ້ນ, ເມື່ອໂຄງການໄດ້ສໍາເລັດການສະແດງຜົນ, ທ່ານສາມາດສື່ສານຄວາມມັກຂອງທ່ານໂດຍອີງໃສ່ຮູບພາບແລະ, ຖ້າຫາກວ່າທ່ານຕ້ອງການ, ມີສີ່ສະບັບທີ່ສ້າງໃຫມ່ອີກເທື່ອຫນຶ່ງ.

DALL-E 2: ລະບົບ AI ໃໝ່ສຳລັບງານສິລະປະ

ນອກເໜືອໄປຈາກ Midjourney, DALL-E 2 ຍັງເປັນລະບົບ AI ໃໝ່ທີ່ສາມາດສ້າງຮູບພາບ ແລະ ສິລະປະຕົວຈິງຈາກຄຳອະທິບາຍພາສາທຳມະຊາດ. ບໍ່ພຽງແຕ່ເທົ່ານັ້ນ, DALL-E 2 ຍັງສາມາດປະສົມປະສານແນວຄວາມຄິດ, ຄຸນລັກສະນະແລະຮູບແບບຕ່າງໆ.

ຄວາມເຂັ້ມແຂງຂອງລະບົບ AI ໃໝ່ ຍັງຢູ່ໃນຄວາມສາມາດໃນການຂະຫຍາຍຮູບພາບທີ່ເກີນກວ່າສິ່ງທີ່ຢູ່ໃນຜ້າໃບຕົ້ນສະບັບ, ການສ້າງ ອົງປະກອບຂະຫຍາຍໃຫມ່. ນອກຈາກນັ້ນ, ມັນສາມາດເຮັດໃຫ້ການປ່ຽນແປງຕົວຈິງກັບຮູບພາບທີ່ມີຢູ່ແລ້ວຈາກຄໍາບັນຍາຍພາສາທໍາມະຊາດແລະສາມາດເພີ່ມແລະເອົາອົງປະກອບທີ່ຄໍານຶງເຖິງເງົາ, ການສະທ້ອນແລະໂຄງສ້າງ.

ຄວາມສາມາດຂອງ DALL-E 2 ຍັງລວມເຖິງການຖ່າຍຮູບ ແລະ ການສ້າງຮູບແບບຕ່າງໆຂອງມັນທີ່ໄດ້ແຮງບັນດານໃຈຈາກຕົ້ນສະບັບ. DALL-E 2 ໄດ້ຮຽນຮູ້ຄວາມສໍາພັນລະຫວ່າງຮູບພາບແລະຂໍ້ຄວາມທີ່ໃຊ້ເພື່ອອະທິບາຍພວກມັນ.

ມັນໃຊ້ຂະບວນການທີ່ເອີ້ນວ່າ "ການແຜ່ກະຈາຍ," ເຊິ່ງເລີ່ມຕົ້ນດ້ວຍຮູບແບບຂອງຈຸດສຸ່ມ ແລະຄ່ອຍໆປ່ຽນຮູບແບບນັ້ນໄປສູ່ຮູບໃດໜຶ່ງ ເມື່ອມັນຮັບຮູ້ລັກສະນະສະເພາະຂອງຮູບນັ້ນ.

ດັ່ງນັ້ນ, ຫຼັງຈາກ OpenAI ໄດ້ນໍາສະເຫນີ DALL-E ໃນເດືອນມັງກອນ 2021, ໃນປັດຈຸບັນລະບົບໃຫມ່ຫຼ້າສຸດ, DALL-E 2, ສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຖືກຕ້ອງຫຼາຍທີ່ມີຄວາມລະອຽດສີ່ເທົ່າ.

DALL-E 2 ໄດ້ເລີ່ມຕົ້ນເປັນໂຄງການຄົ້ນຄ້ວາແລະໃນປັດຈຸບັນສາມາດໃຊ້ໄດ້ເປັນ ສະບັບທົດລອງ. ການຫຼຸດຜ່ອນຄວາມປອດໄພທີ່ລະບົບໄດ້ພັດທະນາ ແລະສືບຕໍ່ປັບປຸງລວມມີ: ການຈຳກັດຄວາມສາມາດຂອງລະບົບໃນການສ້າງຮູບພາບທີ່ຮຸນແຮງ, ກຽດຊັງ ຫຼືຜູ້ໃຫຍ່, ແລະ ການນຳໃຊ້ຂັ້ນຕອນການຮຽນຮູ້.

ທີ່ມາ: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/

Al Generative Art: ການ​ທົດ​ລອງ​ຕົ້ນ​ແລະ​ລັກ​ສະ​ນະ​

Midjourney: ການອອກແບບ, ໂຄງສ້າງພື້ນຖານຂອງມະນຸດ, ແລະປັນຍາປະດິດ

DALL-E 2: ລະບົບ AI ໃໝ່ສຳລັບງານສິລະປະ

Al Generative Art: ການທົດລອງຕົ້ນແລະລັກສະນະ