Al Generative Art ແມ່ນປະເພດຂອງສິລະປະ, ໃນກໍລະນີຫຼາຍທີ່ສຸດ, ແມ່ນອີງໃສ່ການຮ່ວມມືລະຫວ່າງມະນຸດແລະລະບົບເອກະລາດ. "ລະບົບປົກຄອງຕົນເອງ" ຖືກກໍານົດວ່າເປັນ ປັນຍາປະດິດ ຊອບແວ, algorithm ຫຼືຕົວແບບທີ່ມີຄວາມສາມາດປະຕິບັດການດໍາເນີນງານທີ່ສັບສົນໂດຍບໍ່ຈໍາເປັນຕ້ອງມີການແຊກແຊງຂອງໂປລແກລມ.
ຈາກ juxtapositions bizarre ຂອງຮູບພາບທີ່ສ້າງຂຶ້ນໂດຍ Dall-E Mini ການ NFT ຕະຫຼາດ, ຮູບພາບທີ່ຜະລິດໂດຍ AI algorithms ກໍາລັງເຂົ້າສູ່ຈິນຕະນາການຕົ້ນຕໍ. ໃນຄວາມເປັນຈິງ, ສອງໂຄງການທີ່ສໍາຄັນກ່ຽວກັບວິຊາທີ່ສົມຄວນໄດ້ຮັບການວິເຄາະແມ່ນ: ກາງແຈ້ງ ແລະ DALL-E2.
ແນ່ນອນ, ຂ່າວຍັງເຮັດໃຫ້ວິທີການຂອງຕົນໄປສູ່ Twitter. ຄໍາເຫັນກ່ຽວກັບມັນ, ແລະອື່ນໆ, ແມ່ນ Charles Hoskinson, ຜູ້ທີ່ຂຽນວ່າ:
AI ສ້າງສິລະປະ. ຂ້ອຍສາມາດສ້າງຮູບນີ້ໃນເວລາພຽງສອງສາມນາທີ. ຂ້າພະເຈົ້າບໍ່ສາມາດຈິນຕະນາການວິທີການທີ່ຫນ້າສັງເກດເຕັກໂນໂລຊີນີ້ຈະເປັນໃນ 3 ປີ pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) ກຸມພາ 1, 2023
Al Generative Art: ການທົດລອງຕົ້ນແລະລັກສະນະ
ໂດຍເຂົ້າໃຈສິ່ງທີ່ Generative Art ແມ່ນຫຍັງ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະເນັ້ນຫນັກໃສ່ຫນຶ່ງໃນຫຼັກການພື້ນຖານຂອງມັນ: ຄວາມສຸ່ມ. ເຊິ່ງເປັນຊັບສິນພື້ນຖານຂອງສິລະປະທົ່ວໄປ.
ໃນຄວາມເປັນຈິງ, ອີງຕາມປະເພດຂອງຊອບແວ, ລະບົບປົກຄອງຕົນເອງສາມາດປະມວນຜົນຜົນໄດ້ຮັບທີ່ແຕກຕ່າງກັນແລະເປັນເອກະລັກໃນແຕ່ລະເວລາທີ່ຄໍາສັ່ງສ້າງ, ຫຼືມັນສາມາດສົ່ງຜົນໄດ້ຮັບຈໍານວນການປ່ຽນແປງເພື່ອຕອບສະຫນອງການປ້ອນຂໍ້ມູນຂອງຜູ້ໃຊ້.
ການທົດລອງຄັ້ງທໍາອິດໃນ Generative Art ມີວັນທີກັບຄືນໄປບ່ອນ 1960s ກັບການທົດລອງຂອງ Harold Cohen ແລະລາວ ອາໂຣນ ໂຄງການ. ທໍາອິດ Cohen ໄດ້ໃຊ້ຊອບແວແບບຢືນຢູ່ຄົນດຽວເພື່ອສ້າງງານສິລະປະທີ່ບໍ່ມີຕົວຕົນທີ່ໄດ້ຮັບແຮງບັນດານໃຈໂດຍ Pop Art silkscreens. ປະຈຸບັນ, ວຽກງານຂອງ Cohen ໄດ້ຖືກສະແດງຢູ່ຫໍວາງສະແດງ Tate ໃນລອນດອນ.
ຄຸນລັກສະນະອື່ນຂອງ Generative Art, ແຕ່ຫນຶ່ງທີ່ຫນ້ອຍແລະຫນ້ອຍ prerogative, ແມ່ນການຊໍ້າຄືນຂອງຮູບແບບຫຼືອົງປະກອບທີ່ບໍ່ມີຕົວຕົນສະຫນອງໃຫ້ໂດຍ programmer ແລະປະຕິບັດພາຍໃນລະຫັດຊອບແວ.
ນອກຈາກນັ້ນ, ການພັດທະນາຂອງເຄືອຂ່າຍ neural ສະລັບສັບຊ້ອນທີ່ເພີ່ມຂຶ້ນທີ່ດໍາເນີນການກ່ຽວກັບການເຊື່ອມໂຍງຂໍ້ຄວາມ - ຮູບພາບໄດ້ຊ່ວຍໃຫ້ການພັດທະນາແບບຈໍາລອງທີ່ມີຄວາມສາມາດໃນການສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຖືກຕ້ອງຫຼາຍຂຶ້ນ. ຕົວຢ່າງທີ່ຮູ້ຈັກດີທີ່ສຸດຂອງປະເພດສິລະປະທົ່ວໄປນີ້ແມ່ນ ດາລ-ອີ.
Dall-E ແມ່ນເຄືອຂ່າຍ neural multimodal ໂດຍອີງໃສ່ GPT-3 ຮູບແບບການຮຽນຮູ້ເລິກຈາກ OpenAI, ບໍລິສັດດຽວກັນທີ່ຍັງພັດທະນາບໍ່ດົນມານີ້ ສົນທະນາ GPT, chatbot ເປີດຕົວໃນເດືອນພະຈິກ 2022 ແລະ optimized ກັບ "ຄວບຄຸມ" ແລະເຕັກນິກການຮຽນຮູ້ເສີມ.
ກັບຄືນໄປຫາ Dall-E, ພວກເຮົາເຫັນວ່າລະບົບນີ້ມີຄວາມສາມາດສ້າງຮູບພາບຈາກຄໍາອະທິບາຍຂໍ້ຄວາມ, ເອີ້ນວ່າ a. "ກະຕຸ້ນ," ອີງໃສ່ຊຸດຂໍ້ມູນຂອງຄູ່ຂໍ້ຄວາມ-ຮູບພາບ.
ຮຸ່ນທໍາອິດຂອງ Dall-E, ເຊິ່ງໄດ້ຖືກນໍາສະເຫນີຕໍ່ສາທາລະນະໃນເດືອນມັງກອນ 2021 ແລະຍັງຄົງເປັນສິດທິພິເສດຂອງຜູ້ຊ່ຽວຊານໃນພາກສະຫນາມຈໍານວນຫນ້ອຍ, ເປັນຕົວແທນຂອງການປະຕິວັດທີ່ແທ້ຈິງໃນປະເພດຂອງຮູບແບບການຜະລິດນີ້, ລື່ນກາຍການປະດິດສ້າງຂອງ GPT-. 3 ຕົວຂອງມັນເອງ.
ນອກຈາກນີ້ຍັງມີຄວາມສໍາຄັນແມ່ນຄວາມຈິງທີ່ວ່າຄວາມຖືກຕ້ອງຂອງຜົນໄດ້ຮັບທີ່ດໍາເນີນການໂດຍ Dall-E ພິສູດວ່າເປັນຂອບເຂດທີ່ສົມບູນແບບສໍາລັບການແກ້ໄຂ OpenAI ອື່ນ: ຄລິບ (Contrastive Language-Image Pre-training).
ການຈັດປະເພດຮູບພາບແລະການຈັດອັນດັບເຄືອຂ່າຍ neural ທີ່ໄດ້ຮັບການຝຶກອົບຮົມບົນພື້ນຖານຂອງສະມາຄົມຂໍ້ຄວາມຮູບພາບ, ເຊັ່ນ: ຄໍາບັນຍາຍທີ່ພົບເຫັນຢູ່ໃນອິນເຕີເນັດ. ຂໍຂອບໃຈກັບການແຊກແຊງຂອງ CLIP, ເຊິ່ງເຮັດໃຫ້ຈໍານວນຜົນໄດ້ຮັບທີ່ສະເຫນີຕໍ່ຜູ້ໃຊ້ຕໍ່ການກະຕຸ້ນເຕືອນເຖິງ 32, Dall-E ໄດ້ຖືກພົບເຫັນວ່າສົ່ງຄືນຮູບພາບທີ່ຫນ້າພໍໃຈໃນກໍລະນີຫຼາຍທີ່ສຸດ.
Midjourney: ການອອກແບບ, ໂຄງສ້າງພື້ນຖານຂອງມະນຸດ, ແລະປັນຍາປະດິດ
ຕາມທີ່ຄາດໄວ້, ກາງແຈ້ງ ເປັນໂຄງການທີ່ສໍາຄັນທີ່ເປັນສ່ວນຫນຶ່ງຂອງແນວຄວາມຄິດສິລະປະ Al Generative ທີ່ພົ້ນເດັ່ນຂື້ນ. ໂດຍສະເພາະ, Midjourney ແມ່ນຫ້ອງທົດລອງການຄົ້ນຄວ້າເອກະລາດທີ່ຄົ້ນຫາວິທີການຄິດໃຫມ່ແລະຂະຫຍາຍອໍານາດຈິນຕະນາການຂອງຊະນິດຂອງມະນຸດ.
ການນໍາໃຊ້ມັນແມ່ນງ່າຍດາຍ: ທໍາອິດບັນຊີຕ້ອງໄດ້ຮັບການສ້າງຕັ້ງຂຶ້ນໃນ Discord, ເປັນເວທີທີ່ເປັນເຈົ້າພາບຊຸມຊົນຕ່າງໆ, ບ່ອນທີ່ Midjourney ແມ່ນຫນຶ່ງໃນພວກເຂົາ. ພາຍໃນຄໍາຮ້ອງສະຫມັກແມ່ນຫ້ອງສົນທະນາຕ່າງໆເຊິ່ງບຸກຄົນໃດຫນຶ່ງສາມາດເຂົ້າຮ່ວມຢ່າງຈິງຈັງຫຼືບໍ່ໃນການສົນທະນາ.
ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະຊີ້ໃຫ້ເຫັນວ່າເພື່ອພະຍາຍາມໃຊ້ Artificial Intelligence ເປັນຄັ້ງທໍາອິດຫນຶ່ງຕ້ອງໄປຫາ "ມືໃຫມ່" ຊ່ອງທາງ, ບ່ອນທີ່ 25 ການສະແດງຟຣີ ມີຢູ່.
ການສະແດງຜົນອັນໜຶ່ງກົງກັບການສ້າງສີ່ຕົວແປທີ່ແຕກຕ່າງກັນທີ່ສ້າງຂຶ້ນຈາກການປ້ອນຂໍ້ຄວາມດຽວກັນ.
ດັ່ງນັ້ນ, 25 renders ຫມາຍເຖິງ 25 ວຽກປຸງແຕ່ງທີ່ປະຕິບັດໂດຍ Midjourney bot. ດັ່ງນັ້ນ, ການສ້າງຮູບພາບຮຽກຮ້ອງໃຫ້ມີການພົວພັນກັບ Midjourney bot ຜ່ານຂໍ້ຄວາມທີ່ເອີ້ນວ່າ "ກະຕຸ້ນ", ເຊິ່ງໃນນັ້ນຈະມີຄໍາທີ່ອະທິບາຍເຖິງຮູບພາບທີ່ຜູ້ໃຊ້ມີຢູ່ໃນໃຈ.
ທ່ານສາມາດເພີ່ມລາຍລະອຽດຫຼາຍເທົ່າທີ່ທ່ານຕ້ອງການ, ສິ່ງທີ່ສໍາຄັນແມ່ນການແບ່ງຄໍາສໍາຄັນດ້ວຍເຄື່ອງໝາຍຈຸດ. ເມື່ອການ rendering ສໍາເລັດ, ຄອມພິວເຕີຈະສົ່ງຄືນສີ່ຮູບທີ່ແຕກຕ່າງກັນໂດຍອີງໃສ່ຄໍາອະທິບາຍທີ່ຈະເລືອກເອົາຈາກ.
ນອກຈາກນັ້ນ, ເມື່ອໂຄງການໄດ້ສໍາເລັດການສະແດງຜົນ, ທ່ານສາມາດສື່ສານຄວາມມັກຂອງທ່ານໂດຍອີງໃສ່ຮູບພາບແລະ, ຖ້າຫາກວ່າທ່ານຕ້ອງການ, ມີສີ່ສະບັບທີ່ສ້າງໃຫມ່ອີກເທື່ອຫນຶ່ງ.
DALL-E 2: ລະບົບ AI ໃໝ່ສຳລັບງານສິລະປະ
ນອກເໜືອໄປຈາກ Midjourney, DALL-E 2 ຍັງເປັນລະບົບ AI ໃໝ່ທີ່ສາມາດສ້າງຮູບພາບ ແລະ ສິລະປະຕົວຈິງຈາກຄຳອະທິບາຍພາສາທຳມະຊາດ. ບໍ່ພຽງແຕ່ເທົ່ານັ້ນ, DALL-E 2 ຍັງສາມາດປະສົມປະສານແນວຄວາມຄິດ, ຄຸນລັກສະນະແລະຮູບແບບຕ່າງໆ.
ຄວາມເຂັ້ມແຂງຂອງລະບົບ AI ໃໝ່ ຍັງຢູ່ໃນຄວາມສາມາດໃນການຂະຫຍາຍຮູບພາບທີ່ເກີນກວ່າສິ່ງທີ່ຢູ່ໃນຜ້າໃບຕົ້ນສະບັບ, ການສ້າງ ອົງປະກອບຂະຫຍາຍໃຫມ່. ນອກຈາກນັ້ນ, ມັນສາມາດເຮັດໃຫ້ການປ່ຽນແປງຕົວຈິງກັບຮູບພາບທີ່ມີຢູ່ແລ້ວຈາກຄໍາບັນຍາຍພາສາທໍາມະຊາດແລະສາມາດເພີ່ມແລະເອົາອົງປະກອບທີ່ຄໍານຶງເຖິງເງົາ, ການສະທ້ອນແລະໂຄງສ້າງ.
ຄວາມສາມາດຂອງ DALL-E 2 ຍັງລວມເຖິງການຖ່າຍຮູບ ແລະ ການສ້າງຮູບແບບຕ່າງໆຂອງມັນທີ່ໄດ້ແຮງບັນດານໃຈຈາກຕົ້ນສະບັບ. DALL-E 2 ໄດ້ຮຽນຮູ້ຄວາມສໍາພັນລະຫວ່າງຮູບພາບແລະຂໍ້ຄວາມທີ່ໃຊ້ເພື່ອອະທິບາຍພວກມັນ.
ມັນໃຊ້ຂະບວນການທີ່ເອີ້ນວ່າ "ການແຜ່ກະຈາຍ," ເຊິ່ງເລີ່ມຕົ້ນດ້ວຍຮູບແບບຂອງຈຸດສຸ່ມ ແລະຄ່ອຍໆປ່ຽນຮູບແບບນັ້ນໄປສູ່ຮູບໃດໜຶ່ງ ເມື່ອມັນຮັບຮູ້ລັກສະນະສະເພາະຂອງຮູບນັ້ນ.
ດັ່ງນັ້ນ, ຫຼັງຈາກ OpenAI ໄດ້ນໍາສະເຫນີ DALL-E ໃນເດືອນມັງກອນ 2021, ໃນປັດຈຸບັນລະບົບໃຫມ່ຫຼ້າສຸດ, DALL-E 2, ສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຖືກຕ້ອງຫຼາຍທີ່ມີຄວາມລະອຽດສີ່ເທົ່າ.
DALL-E 2 ໄດ້ເລີ່ມຕົ້ນເປັນໂຄງການຄົ້ນຄ້ວາແລະໃນປັດຈຸບັນສາມາດໃຊ້ໄດ້ເປັນ ສະບັບທົດລອງ. ການຫຼຸດຜ່ອນຄວາມປອດໄພທີ່ລະບົບໄດ້ພັດທະນາ ແລະສືບຕໍ່ປັບປຸງລວມມີ: ການຈຳກັດຄວາມສາມາດຂອງລະບົບໃນການສ້າງຮູບພາບທີ່ຮຸນແຮງ, ກຽດຊັງ ຫຼືຜູ້ໃຫຍ່, ແລະ ການນຳໃຊ້ຂັ້ນຕອນການຮຽນຮູ້.
ທີ່ມາ: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/