ຂໍ້ຄວາມຫາ 3D ໃຫມ່ຂອງ Nvidia ຫມາຍຄວາມວ່າແນວໃດສໍາລັບວິສະວະກໍາ & ການອອກແບບຜະລິດຕະພັນ

tl dr: AI ທົ່ວໄປກໍາລັງພັດທະນາຢູ່ໃນຈັງຫວະທີ່ຫນ້າຕື່ນເຕັ້ນ. ສູດການຄິດໄລ່ຫຼ້າສຸດໂດຍ Nvidia ປ່ຽນຂໍ້ຄວາມເປັນຕາໜ່າງ 3D ສອງເທົ່າໄວກວ່າໂຄງການທີ່ເຜີຍແຜ່ເມື່ອ 2 ເດືອນກ່ອນ. ນີ້ຫມາຍຄວາມວ່າຄວາມສາມາດດ້ານວິຊາການໃນປັດຈຸບັນໄດ້ລື່ນກາຍຄວາມສາມາດຂອງພວກເຮົາທີ່ຈະເຮັດວຽກກັບພວກເຂົາ.

ອາທິດທີ່ຜ່ານມາ ເຈ້ຍ ໂດຍນັກວິທະຍາສາດ Nvidia ໄດ້ສະແດງໃຫ້ເຫັນເຖິງຄວາມໄວຂອງຕົວເລກທີ່ຊ່ອງ AI ຜະລິດກໍາລັງພັດທະນາ. ການລະເບີດຂອງກິດຈະກໍານີ້ - ໂດຍສະເພາະທີ່ເຫັນໄດ້ໃນໄລຍະ 9 ເດືອນທີ່ຜ່ານມາ - ຈະມີຜົນກະທົບໃນທຸກພາກສ່ວນຂອງຊີວິດ, ບໍ່ຢ່າງຫນ້ອຍໃນການອອກແບບຜະລິດຕະພັນ, ວິສະວະກໍາແລະການຜະລິດ. ການປ່ຽນແປງຈະຂັດຂວາງອຸດສາຫະກໍາຈາກຂໍ້ຈໍາກັດທາງດ້ານໂຄງສ້າງໃນວິທີການສື່ສານແນວຄວາມຄິດ, ເສີມສ້າງຮອບວຽນນະວັດກໍາທີ່ໄວຂຶ້ນແລະໃນທີ່ສຸດມັນເຮັດໃຫ້ສັນຍາຄວາມຍືນຍົງຂອງມັນ.

ຕົວຢ່າງ Meshes ຈາກ Nvidia Research's Magic 3D algorithms, ດ້ວຍການກະຕຸ້ນເຕືອນທີ່ໃຊ້ເພື່ອສ້າງພວກມັນ.

Nvidia ການຄົ້ນຄວ້າຈິນຕະນາການເລິກ

ໄດ້ຖືກບອກມາເປັນເວລາຫລາຍປີວ່າ AI ຈະປະຕິວັດວິທີການເຮັດວຽກຂອງພວກເຮົາໂດຍພື້ນຖານ, ຈໍານວນຫນ້ອຍທີ່ຄາດວ່າຂະແຫນງການສ້າງສັນຈະເປັນຫນຶ່ງໃນຜູ້ຖືກເຄາະຮ້າຍທໍາອິດ. ການມາເຖິງຂອງເຄື່ອງສ້າງຂໍ້ຄວາມທີ່ຄ້າຍຄືກັບມະນຸດຂອງ GPT-3 ໃນປີ 2020 ໄດ້ນໍາເອົາຄວາມເປັນໄປໄດ້ໄປສູ່ຈຸດສຸມທີ່ຊັດເຈນກວ່າ. ມັນເປັນການຂັບເຄື່ອນທໍາມະຊາດຕັ້ງແຕ່ນັ້ນມາ: DALL-E (ຂໍ້ຄວາມເປັນຮູບພາບ), Whisper (ການຮັບຮູ້ສຽງເວົ້າ), ແລະຫລ້າສຸດ Stable Diffusion (ຂໍ້ຄວາມເປັນຮູບພາບ) ບໍ່ພຽງແຕ່ເພີ່ມຄວາມສາມາດຂອງເຄື່ອງມືການປາກເວົ້າແລະສາຍຕາ, ແຕ່ຍັງ. ຫຼຸດຜ່ອນຊັບພະຍາກອນທີ່ຈໍາເປັນເພື່ອນໍາໃຊ້ພວກມັນ (ຈາກ 175bn ຕົວກໍານົດການສໍາລັບ GPT-3 ເປັນ 900mn ສໍາລັບການແຜ່ກະຈາຍຄົງທີ່).

ຂະໜາດຂອງ Stable Diffusion ໝາຍເຖິງພື້ນທີ່ດິສກ໌ໜ້ອຍກວ່າ 5gb – ສາມາດແລ່ນໄດ້ໃນຄອມພິວເຕີໂນດບຸກໃດນຶ່ງ. ບໍ່ພຽງແຕ່ເທົ່ານັ້ນ; ບໍ່ເຫມືອນກັບ OpenAI (ເຊິ່ງສ່ວນໃຫຍ່ແມ່ນໄດ້ຮັບທຶນຈາກ Microsoft ແລະເຜີຍແຜ່ GPT-3, DALL-E ແລະ Whisper), Stable Diffusion ແມ່ນແຫຼ່ງເປີດ, ຊຶ່ງຫມາຍຄວາມວ່າຄົນອື່ນສາມາດສ້າງການຮຽນຮູ້ຂອງມັນໄດ້ງ່າຍຂຶ້ນ. ນັ້ນ ໝາຍ ຄວາມວ່າພວກເຮົາພຽງແຕ່ເຫັນການເລີ່ມຕົ້ນຂອງວົງຈອນນະວັດຕະ ກຳ - ມີຫຼາຍຢ່າງທີ່ຈະມາເຖິງ, ດັ່ງທີ່ເອກະສານຂອງ Nvidia ສະແດງໃຫ້ເຫັນໃນປັດຈຸບັນ.

ຜູ້ສະຫນັບສະຫນູນຂອງ Stable Diffusion (stability.ai) ແມ່ນ turbocharging ແນວໂນ້ມນີ້ຕື່ມອີກໂດຍການໃຫ້ການຊ່ວຍເຫຼືອດ້ານເຕັກໂນໂລຢີແລະທາງດ້ານການເງິນກັບທີມງານອື່ນໆທີ່ດໍາເນີນການຂຸດຄົ້ນໄປສູ່ທິດທາງໃຫມ່. ນອກຈາກນັ້ນ, ຫຼາຍໆໂຄງການແມ່ນເຮັດໃຫ້ເຄື່ອງມືທີ່ມີໃຫ້ກັບຜູ້ໃຊ້ທີ່ກວ້າງຂຶ້ນເລື້ອຍໆ. ໃນບັນດາພວກມັນມີ plugins ສໍາລັບ Blender, ເຄື່ອງມືອອກແບບແຫຼ່ງເປີດ, ແລະ Adobe's Photoshop ທຽບເທົ່າ. ການເຂົ້າເຖິງ API ເຕັມຮູບແບບແມ່ນໄດ້ຮັບທຶນຈາກ Venture Capital ໂດລາໃຫຍ່, ຊຶ່ງຫມາຍຄວາມວ່າຜູ້ພັດທະນາຊອບແວຫຼາຍຮ້ອຍລ້ານຄົນ, ບໍ່ພຽງແຕ່ວິສະວະກອນຂໍ້ມູນສອງສາມແສນເທົ່ານັ້ນ, ປະຈຸບັນຈະສ້າງເຄື່ອງມືຂອງຕົນເອງໃນ algorithms ເຫຼົ່ານີ້.

ການປາກເວົ້າ, ຮູບພາບແລະຂໍ້ຄວາມແມ່ນໃນບັນດາແນວຕັ້ງທໍາອິດທີ່ຖືກລົບກວນໂດຍເຕັກໂນໂລຢີເຫຼົ່ານີ້. ແຕ່ 3D ແມ່ນບໍ່ໄກຢູ່ຫລັງ. ນອກ ເໜືອ ໄປຈາກສິລະປະການຜະລິດສະເພາະ, ກາຕູນແມ່ນຈຸດ ທຳ ອິດທີ່ຈະແຈ້ງຂອງແອັບພລິເຄຊັນ. ມີເຄື່ອງກໍາເນີດ Pokémon ໂດຍອີງໃສ່ Stable Diffusion ແລ້ວ. Visual Effects ແລະຮູບເງົາແມ່ນຕໍ່ໄປ. ແຕ່ຫຼາຍພາກສ່ວນອື່ນໆມີແນວໂນ້ມທີ່ຈະໄດ້ຮັບການຂັດຂວາງ - ໃນບັນດາພວກເຂົາການອອກແບບພາຍໃນທີ່ມີ Interiorai.com ເປັນຜູ້ນໍາຮັບຜິດຊອບ.

ໃນຄວາມຕື່ນເຕັ້ນທັງໝົດນີ້, ການນຳໃຊ້ນະວັດຕະກໍາໃນການອອກແບບ ແລະ ວິສະວະກຳ ຮູ້ສຶກຄືກັບການຄິດຫຼັງ. ເຖິງຢ່າງໃດກໍຕາມ ມັນເປັນເຂດທີ່ໄດ້ຮັບຜົນກະທົບຢ່າງໜັກໜ່ວງທີ່ສຸດ. ແນ່ນອນ, ມີຄວາມທ້າທາຍໃນເບື້ອງຕົ້ນ: ສໍາລັບຫນຶ່ງ, Stable Diffusion ແລະ compatriots ຍັງບໍ່ທັນຊັດເຈນຫຼາຍ. ນັ້ນບໍ່ແມ່ນບັນຫາສໍາລັບກາຕູນ, ແຕ່ມັນເປັນສິ່ງທ້າທາຍທີ່ສໍາຄັນສໍາລັບຄວາມພະຍາຍາມໃດໆທີ່ຈະປ່ຽນຂໍ້ຄວາມເຂົ້າໄປໃນເລຂາຄະນິດ 3D ເຕັມຮູບແບບທີ່ໃຊ້ໃນສະພາບການອຸດສາຫະກໍາ. ນັ້ນແມ່ນພື້ນທີ່ທີ່ມີຄວາມສົນໃຈບາງຢ່າງ (ໂຄງການທີ່ເອີ້ນວ່າ Bits101 ຖືກເປີດຕົວໃນອິດສະຣາເອນໃນປີ 2015). ນີ້ອາດຈະເປັນບ່ອນສັກສິດຂອງອຸດສາຫະກໍາ, ແຕ່ມີສິ່ງທ້າທາຍລະດັບປານກາງຫຼາຍທີ່ອາດຈະແກ້ໄຂໄດ້ງ່າຍກວ່າ. ເຫຼົ່ານີ້ລວມມີການປັບປຸງການຮັບຮູ້ວັດຖຸ (ລະບົບ Yolo algorithm ຖືກໃຊ້ແລ້ວເພື່ອໃຫ້ມີຜົນດີ), ເຊິ່ງຈະນໍາໄປສູ່ການປັບປຸງການອ້າງອີງແລະຄໍາບັນຍາຍ - ປັບປຸງຄຸນນະພາບແລະຫຼຸດຜ່ອນຄວາມຜິດພາດ. Plugins ຄວນເຮັດໃຫ້ມັນງ່າຍຕໍ່ການໃຊ້ Generative AI ເພື່ອພັດທະນາການອອກແບບພື້ນຖານ (Primitives), ເຊິ່ງຫຼັງຈາກນັ້ນສາມາດດັດແກ້ເພີ່ມເຕີມໃນເຄື່ອງມືການອອກແບບເພື່ອປັບປຸງຄວາມທົນທານຕາມຄວາມຕ້ອງການ. ນັ້ນແມ່ນວິທີການທີ່ໃຊ້ແລ້ວໃນ Altair's Inspire, ເຊິ່ງໄດ້ໃຊ້ການວິເຄາະອົງປະກອບ Finite ເພື່ອເຮັດເຊັ່ນດຽວກັນ. Primitives ເຫຼົ່ານີ້ຍັງສາມາດເປັນຖານຂໍ້ມູນສັງເຄາະຂອງແບບຈໍາລອງຄໍາບັນຍາຍ, ຊຶ່ງໃນນັ້ນມີການຂາດແຄນໃນອຸດສາຫະກໍາ 3D CAD. CEO ແລະຜູ້ກໍ່ຕັ້ງຂອງ Physna ຊີ້ໃຫ້ເຫັນນີ້ຢູ່ໃນບົດຄວາມ ລາຍລະອຽດຄວາມພະຍາຍາມຂອງເຂົາເຈົ້າເອງທີ່ຈະນໍາໃຊ້ວິທີການນະວະນິຍາຍເຫຼົ່ານີ້ເພື່ອສ້າງລາຍລະອຽດຂອງການອອກແບບ 3D, ເຊິ່ງຍັງຊີ້ໃຫ້ເຫັນເຖິງຄວາມຫຍຸ້ງຍາກຈໍານວນຫນຶ່ງໃນການນໍາໃຊ້ຂໍ້ມູນສັງເຄາະເພື່ອຂັບ algorithms ເຫຼົ່ານີ້ ການສ້າງການອອກແບບ 3D ຈາກຮູບແຕ້ມ 2D ເປັນພື້ນທີ່ຄໍາຮ້ອງສະຫມັກອື່ນທີ່ມີທ່າແຮງ, ເຊັ່ນດຽວກັນກັບ CAM ອັດສະລິຍະ - ການໃຫ້ອາຫານອອກ. ຫໍສະມຸດຂອງເຄື່ອງມືໃສ່ເຄື່ອງເພື່ອກໍານົດຍຸດທະສາດເຄື່ອງຈັກທີ່ດີທີ່ສຸດ.

ສິ່ງທ້າທາຍເຫຼົ່ານີ້ມີຄວາມສໍາຄັນ ແລະເປັນຜົນກໍາໄລເພື່ອແກ້ໄຂໃນ ແລະສໍາລັບຕົນເອງ. ແຕ່ຜົນກະທົບຕົ້ນຕໍຂອງພວກເຂົາແມ່ນຈະຊ່ວຍພັດທະນາເສັ້ນທາງແນວຄວາມຄິດໃນການອອກແບບໂດຍການຫຼຸດຜ່ອນການເພິ່ງພາອາໄສການອອກແບບ 3D ເພື່ອສື່ສານຄວາມຕັ້ງໃຈ. ການອອກແບບ, ບໍ່ວ່າຈະເປັນ 2D ຫຼື 3D, ໄດ້ຮັບໃຊ້ເປັນວິທີການຕົ້ນຕໍໃນການແປພາສາຄວາມຕ້ອງການຂອງລູກຄ້າກັບຜະລິດຕະພັນສຸດທ້າຍ. ສິ່ງນັ້ນຂັດຂວາງອຸດສາຫະກໍາເພາະວ່າການອອກແບບເຫຼົ່ານີ້ເຮັດຫນ້າທີ່ເປັນກ່ອງດໍາທີ່ຄວາມເຂົ້າໃຈຂອງລູກຄ້າທີ່ມີຄຸນຄ່າທັງຫມົດເຫຼົ່ານັ້ນ, ຂໍ້ຈໍາກັດການຜະລິດແລະຈຸດປະສົງຂອງບໍລິສັດຖືກເກັບຮັກສາໄວ້, ບໍ່ສາມາດຖືກແຍກອອກໄດ້, ແຕ່ຍັງຖືກກໍານົດຢ່າງດຽວ. ນີ້ຫມາຍຄວາມວ່າໃນເວລາທີ່ບາງສິ່ງບາງຢ່າງມີການປ່ຽນແປງ, ມັນຕໍ່ໄປເປັນໄປບໍ່ໄດ້ພຽງແຕ່ປັບການອອກແບບ. ນີ້ແມ່ນເຫດຜົນທີ່ການປະດິດສ້າງເຊັ່ນການພິມ 3 ມິຕິໃຊ້ເວລາດົນນານເພື່ອຮັບເອົາແລະເປັນເວລາຫຼາຍປີໃຫ້ນັກລົງທຶນໃນໄລຍະສັ້ນຜິດຫວັງ. ອົງປະກອບທີ່ປະກອບເປັນເຮືອບິນແມ່ນ "ຕັ້ງ" ຈາກປັດຈຸບັນທີ່ເຂົາເຈົ້າອອກແບບ, ເຖິງແມ່ນວ່າຈະມີອາຍຸການຜະລິດ 20 ປີ+. ເກືອບບໍ່ມີຂອບເຂດຂອງການປະດິດສ້າງ - ສິ່ງເຫຼົ່ານີ້ຕ້ອງລໍຖ້າການເປີດຕົວຂອງລຸ້ນຕໍ່ໄປ.

ຄວາມສາມາດໃນການປ່ຽນແປງຂໍ້ຈໍາກັດດຽວແລະອະນຸຍາດໃຫ້ algorithm ເຊັ່ນ: Stable Diffusion ເພື່ອປະກອບໃຫມ່ໃນການອອກແບບແລະຕົວກໍານົດການການຜະລິດຈະເລັ່ງການຮັບຮອງເອົານະວັດກໍາໃຫມ່ຢ່າງຫຼວງຫຼາຍແລະຊ່ວຍໃຫ້ພວກເຮົາສ້າງຜະລິດຕະພັນທີ່ອ່ອນກວ່າ, ປະສິດທິພາບທີ່ດີກວ່າ, ໄວຂຶ້ນ. ໃນຂະນະທີ່ພວກເຂົາເຮັດໃນສູດ 1 ຫຼືການອອກແບບລະບົບ, ວິສະວະກອນໃນອະນາຄົດຈະເຮັດຫນ້າທີ່ເປັນຜູ້ຈັດການຂໍ້ຈໍາກັດທີ່ສາມາດສະແດງອອກໃນຄໍາສັບຕ່າງໆແລະອ້າງອີງເຖິງແຫຼ່ງຂໍ້ມູນວ່າຈຸດປະສົງແລະຂໍ້ຈໍາກັດຂອງຜະລິດຕະພັນແມ່ນຫຍັງ.

ໂດຍບໍ່ມີການເລັ່ງຂະບວນການວິສະວະກໍາສໍາລັບຜະລິດຕະພັນໃຫມ່ແລະທີ່ມີຢູ່ແລ້ວດ້ວຍວິທີນີ້, ພວກເຮົາເກືອບບໍ່ມີວິທີການທີ່ຈະບັນລຸເປົ້າຫມາຍຄວາມຍືນຍົງທີ່ມີຄວາມທະເຍີທະຍານທີ່ພວກເຮົາຕ້ອງຕັ້ງຕົວເອງ. ເພື່ອເຮັດສິ່ງນີ້, ທໍາອິດພວກເຮົາຕ້ອງຕົກລົງເຫັນດີກັບພາສາທີ່ພວກເຮົາສາມາດນໍາໃຊ້ເພື່ອຕິດຕໍ່ສື່ສານນອກເຫນືອການອອກແບບ. ຮູບແບບ semantic ໃຫມ່ນີ້ແມ່ນຊ່ອງຫວ່າງທີ່ຈະແຈ້ງໃນການປະດິດສ້າງທີ່ໄດ້ກ່າວມາຂ້າງເທິງ. ບໍລິສັດຈໍານວນຫນຶ່ງໄດ້ເລີ່ມຕົ້ນແລ້ວທີ່ຈະທົດລອງກັບມັນ, ເຊັ່ນ: nTopology ກັບແນວຄວາມຄິດຂອງ Fields. ແລະທັນ, ຈັງຫວະຂອງການປ່ຽນແປງແມ່ນຊ້າ, ບໍ່ເຫມືອນກັບ algorithms ທີ່ຕົວແບບ semantic ຈະລ້ຽງ. ຂັ້ນຕອນວິທີການໃຫມ່ຂອງ Nvidia ມີລາຍງານວ່າໄວກວ່າສອງເທົ່າ DreamFusion, ຈັດພີມມາຫນ້ອຍກວ່າ 2 ເດືອນກ່ອນຫນ້ານີ້. ບໍລິສັດຜະລິດຕະພັນແລະວິສະວະກໍາຈໍາເປັນຕ້ອງໄດ້ເຮັດວຽກກ່ຽວກັບການຈັບແນວຄວາມຄິດຂອງເຂົາເຈົ້າໃນວິທີການໃຫມ່, ໃນອະນາຄົດຫຼັກຖານສະແດງໃນປັດຈຸບັນເພື່ອເຮັດໃຫ້ຫຼາຍທີ່ສຸດຂອງຄວາມເປັນໄປໄດ້ທີ່ການລະເບີດຂອງ AI ການຜະລິດນີ້ຖື. ຄວາມໄວຂອງການປ່ຽນແປງໃນສູດການຄິດໄລ່ໄດ້ສະແດງໃຫ້ເຫັນ, ອີກເທື່ອຫນຶ່ງ, ວ່າກົດຫມາຍ Morse ນໍາໃຊ້ຢູ່ທົ່ວທຸກແຫ່ງທີ່ເຄື່ອງມືຈະຖືກດິຈິຕອນ. ສິ່ງທ້າທາຍຍັງຄົງເປັນຄວາມບໍ່ສາມາດຂອງມະນຸດຂອງພວກເຮົາທີ່ຈະຍອມຮັບການປ່ຽນແປງນີ້ແລະນໍາໃຊ້ວິທີການສື່ສານໃຫມ່ທີ່ມີຄວາມສາມາດໃນການປົດລັອກທ່າແຮງຂອງເຂົາເຈົ້າ, ເຖິງແມ່ນວ່າວຽກງານທີ່ຮີບດ່ວນ.

ແຫຼ່ງຂໍ້ມູນ: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering-product-design/