GPT-4, ຮຸ່ນຫຼ້າສຸດຂອງ Artificial Intelligence (AI) chatbot, ChatGPT, ສາມາດຜ່ານການສອບເສັງຊັ້ນສູງແລະການສອບເສັງໂຮງຮຽນກົດຫມາຍດ້ວຍຄະແນນການຈັດອັນດັບໃນອັດຕາສ່ວນຮ້ອຍລະ 90 ແລະມີຄວາມສາມາດປະມວນຜົນໃຫມ່ທີ່ບໍ່ເປັນໄປໄດ້ກັບຮຸ່ນກ່ອນ.
ຕົວເລກຈາກຄະແນນການທົດສອບຂອງ GPT-4 ໄດ້ຖືກແບ່ງປັນໃນວັນທີ 14 ເດືອນມີນາໂດຍຜູ້ສ້າງ OpenAI ເປີດເຜີຍວ່າມັນຍັງສາມາດປ່ຽນຮູບພາບ, ສຽງແລະວິດີໂອເຂົ້າໃນຂໍ້ຄວາມນອກເຫນືອຈາກການຈັດການ "ຄໍາແນະນໍາທີ່ລະອຽດອ່ອນຫຼາຍ" ສ້າງສັນແລະເຊື່ອຖືໄດ້.
"ມັນຜ່ານການສອບເສັງແຖບ simulated ດ້ວຍຄະແນນປະມານ 10% ຂອງຜູ້ສອບເສັງ," OpenAI ເພີ່ມ. "ໃນທາງກົງກັນຂ້າມ, ຄະແນນຂອງ GPT-3.5 ແມ່ນປະມານລຸ່ມສຸດ 10%.
ຕົວເລກສະແດງໃຫ້ເຫັນວ່າ GPT-4 ບັນລຸໄດ້ຄະແນນ 163 ໃນສ່ວນຮ້ອຍ 88 ໃນການສອບເສັງ LSAT — ນັກສຶກສາວິທະຍາໄລການທົດສອບຈໍາເປັນຕ້ອງຜ່ານໃນສະຫະລັດອາເມລິກາເພື່ອເຂົ້າໄປໃນໂຮງຮຽນກົດຫມາຍ.
ຄະແນນຂອງ GPT4 ຈະເຮັດໃຫ້ມັນຢູ່ໃນຕໍາແຫນ່ງທີ່ດີທີ່ຈະເຂົ້າຮຽນໃນໂຮງຮຽນກົດຫມາຍສູງສຸດ 20 ແລະມີພຽງແຕ່ຈໍານວນຫນ້ອຍຂອງຄະແນນທີ່ລາຍງານທີ່ຈໍາເປັນສໍາລັບການຍອມຮັບກັບໂຮງຮຽນທີ່ມີຊື່ສຽງເຊັ່ນ Harvard, Stanford, Princeton ຫຼື Yale.
ຮຸ່ນກ່ອນຂອງ ChatGPT ພຽງແຕ່ໄດ້ຄະແນນ 149 ໃນ LSAT ທີ່ເຮັດໃຫ້ມັນຢູ່ໃນລຸ່ມ 40%.
GPT-4 ຍັງໄດ້ຄະແນນ 298 ຈາກ 400 ໃນການສອບເສັງ Uniform Bar Exam - ການທົດສອບທີ່ດໍາເນີນໂດຍນັກສຶກສາກົດຫມາຍທີ່ຈົບການສຶກສາບໍ່ດົນມານີ້ອະນຸຍາດໃຫ້ພວກເຂົາປະຕິບັດເປັນທະນາຍຄວາມຢູ່ໃນເຂດປົກຄອງຂອງສະຫະລັດ.
ຮຸ່ນເກົ່າຂອງ ChatGPT ໄດ້ຕໍ່ສູ້ໃນການທົດສອບນີ້, ຈົບລົງຢູ່ລຸ່ມສຸດ 10% ດ້ວຍຄະແນນ 213 ຈາກທັງໝົດ 400 ຄະແນນ.
ສໍາລັບ SAT Evidence-Based Reading & Writing and SAT Math exams taken by US high school students to measure their college ready, GPT-4 scored in the 93rd and 89th percentile ຕາມລໍາດັບ.
GPT-4 ດີເລີດໃນວິທະຍາສາດ "ຍາກ" ເກີນໄປ, ປະກາດໄດ້ດີກວ່າຄະແນນສະເລ່ຍຂອງ AP Biology (85-100%), ເຄມີສາດ (71-88%) ແລະຟີຊິກ 2 (66-84%).
ຢ່າງໃດກໍຕາມ, AP Calculus ຄະແນນຂອງຕົນແມ່ນຂ້ອນຂ້າງສະເລ່ຍ, ຈັດອັນດັບໃນ 43r ຫາ 59 ເປີເຊັນ.
ພື້ນທີ່ອື່ນທີ່ GPT-4 ຂາດແມ່ນໃນການສອບເສັງວັນນະຄະດີພາສາອັງກິດ, ປະກາດຄະແນນໃນສ່ວນຮ້ອຍທີ 8 ຫາ 44 ໃນສອງການທົດສອບແຍກຕ່າງຫາກ.
OpenAI ກ່າວວ່າ GPT-4 ແລະ GPT-3.5 ໄດ້ທົດສອບເຫຼົ່ານີ້ຈາກການສອບເສັງພາກປະຕິບັດ 2022-2023, ແລະວ່າ "ບໍ່ມີການຝຶກອົບຮົມສະເພາະ" ໄດ້ຖືກປະຕິບັດໂດຍເຄື່ອງມືປະມວນຜົນພາສາ:
"ພວກເຮົາບໍ່ໄດ້ຝຶກອົບຮົມສະເພາະສໍາລັບການສອບເສັງເຫຼົ່ານີ້. ສ່ວນນ້ອຍຂອງບັນຫາໃນການສອບເສັງແມ່ນເຫັນໄດ້ຈາກຕົວແບບໃນລະຫວ່າງການຝຶກອົບຮົມ, ແຕ່ພວກເຮົາເຊື່ອວ່າຜົນໄດ້ຮັບແມ່ນເປັນຕົວແທນ.”
ຜົນໄດ້ຮັບເຮັດໃຫ້ເກີດຄວາມຢ້ານກົວໃນຊຸມຊົນ Twitter ເຊັ່ນກັນ.
ທີ່ກ່ຽວຂ້ອງ: ChatGPT ຈະມີຜົນກະທົບແນວໃດຕໍ່ພື້ນທີ່ Web3? ຄໍາຕອບອຸດສາຫະກໍາ
Nick Almond, ຜູ້ກໍ່ຕັ້ງ FactoryDAO ບອກ ຜູ້ຕິດຕາມ Twitter ຂອງລາວ 14,300 ຄົນໃນວັນທີ 14 ມີນານີ້ວ່າ GPT4 ຈະ "ຢ້ານຄົນ" ແລະມັນຈະ "ພັງລົງ" ລະບົບການສຶກສາທົ່ວໂລກ.
ທິດສະດີການປະເມີນແມ່ນເປັນກ້ອນໃຫຍ່ໃນຊີວິດຂອງຂ້ອຍເປັນເວລາຫຼາຍປີ. ຂ້າພະເຈົ້າໄດ້ banging ກ່ຽວກັບມື້ນີ້ມາຫຼາຍປີກ່ອນຫນ້ານີ້. ຂ້າ ພະ ເຈົ້າ ຮູ້ ຫນັງ ສື sounded ຄື crank ທີ່ ຢູ່ ອາ ໄສ ໃນ ເວ ລາ ນັ້ນ.
ແຕ່... ອັນນີ້ໝາຍຄວາມວ່າອັນໃດອັນໜຶ່ງນອກຈາກການປະເມີນແບບ inviilated ແມ່ນຈົບຈາກຈຸດນີ້ໄປ.
— drnick ️² (@DrNickA) ມີນາ 14, 2023
ອະດີດຜູ້ອໍານວຍການ Coinbase, Conor Grogan, ກ່າວວ່າລາວໄດ້ໃສ່ສັນຍາສະຫມາດ Ethereum ສົດໆເຂົ້າໄປໃນ GPT-4 ແລະຊີ້ໃຫ້ເຫັນເຖິງ "ຄວາມອ່ອນແອດ້ານຄວາມປອດໄພ" ທັນທີທັນໃດແລະໄດ້ອະທິບາຍວ່າລະຫັດສາມາດຖືກຂູດຮີດແນວໃດ:
ຂ້ອຍໄດ້ຖິ້ມສັນຍາ Ethereum ສົດໃສ່ GPT-4.
ໃນທັນທີ, ມັນໄດ້ຊີ້ໃຫ້ເຫັນຈຸດອ່ອນດ້ານຄວາມປອດໄພຈໍານວນຫນຶ່ງແລະຊີ້ໃຫ້ເຫັນພື້ນທີ່ຫນ້າດິນທີ່ສັນຍາສາມາດຖືກຂູດຮີດ. ຫຼັງຈາກນັ້ນມັນໄດ້ຢືນຢັນວິທີການສະເພາະທີ່ຂ້ອຍສາມາດຂຸດຄົ້ນສັນຍາໄດ້ pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) ມີນາ 14, 2023
ການກວດສອບສັນຍາ smart ກ່ອນຫນ້ານີ້ໃນ ChatGPT ພົບວ່າຮຸ່ນທໍາອິດຂອງມັນຍັງສາມາດສັງເກດເຫັນຂໍ້ບົກພ່ອງຂອງລະຫັດໃນລະດັບທີ່ສົມເຫດສົມຜົນເຊັ່ນດຽວກັນ.
Rowan Cheung, ຜູ້ກໍ່ຕັ້ງຂອງຈົດຫມາຍຂ່າວ AI "The Rundown" ແບ່ງປັນວິດີໂອຂອງ GPT ຖ່າຍທອດເວັບໄຊທ໌ປອມທີ່ແຕ້ມດ້ວຍມືໃສ່ເຈ້ຍເປັນລະຫັດ.
ຂ້າພະເຈົ້າພຽງແຕ່ເບິ່ງ GPT-4 ຫັນຮູບແຕ້ມທີ່ແຕ້ມດ້ວຍມືເຂົ້າໄປໃນເວັບໄຊທ໌ທີ່ເປັນປະໂຫຍດ.
ນີ້ແມ່ນບ້າ. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) ມີນາ 14, 2023
ທີ່ມາ: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts