ChatGPT V4 aces ແຖບ, SATs ແລະສາມາດກໍານົດການຂູດຮີດໃນສັນຍາ ETH

GPT-4, ຮຸ່ນຫຼ້າສຸດຂອງ Artificial Intelligence (AI) chatbot, ChatGPT, ສາມາດຜ່ານການສອບເສັງຊັ້ນສູງແລະການສອບເສັງໂຮງຮຽນກົດຫມາຍດ້ວຍຄະແນນການຈັດອັນດັບໃນອັດຕາສ່ວນຮ້ອຍລະ 90 ແລະມີຄວາມສາມາດປະມວນຜົນໃຫມ່ທີ່ບໍ່ເປັນໄປໄດ້ກັບຮຸ່ນກ່ອນ.

ຕົວເລກຈາກຄະແນນການທົດສອບຂອງ GPT-4 ໄດ້ຖືກແບ່ງປັນໃນວັນທີ 14 ເດືອນມີນາໂດຍຜູ້ສ້າງ OpenAI ເປີດເຜີຍວ່າມັນຍັງສາມາດປ່ຽນຮູບພາບ, ສຽງແລະວິດີໂອເຂົ້າໃນຂໍ້ຄວາມນອກເຫນືອຈາກການຈັດການ "ຄໍາແນະນໍາທີ່ລະອຽດອ່ອນຫຼາຍ" ສ້າງສັນແລະເຊື່ອຖືໄດ້.

"ມັນຜ່ານການສອບເສັງແຖບ simulated ດ້ວຍຄະແນນປະມານ 10% ຂອງຜູ້ສອບເສັງ," OpenAI ເພີ່ມ. "ໃນທາງກົງກັນຂ້າມ, ຄະແນນຂອງ GPT-3.5 ແມ່ນປະມານລຸ່ມສຸດ 10%.

ຕົວ​ເລກ​ສະ​ແດງ​ໃຫ້​ເຫັນ​ວ່າ GPT-4 ບັນ​ລຸ​ໄດ້​ຄະ​ແນນ 163 ໃນ​ສ່ວນ​ຮ້ອຍ 88 ໃນ​ການ​ສອບ​ເສັງ LSAT — ນັກ​ສຶກ​ສາ​ວິ​ທະ​ຍາ​ໄລ​ການ​ທົດ​ສອບ​ຈໍາ​ເປັນ​ຕ້ອງ​ຜ່ານ​ໃນ​ສະ​ຫະ​ລັດ​ອາ​ເມລິ​ກາ​ເພື່ອ​ເຂົ້າ​ໄປ​ໃນ​ໂຮງ​ຮຽນ​ກົດ​ຫມາຍ​.

ຜົນ​ການ​ສອບ​ເສັງ​ຂອງ GPT-4 ແລະ GPT-3.5 ໃນ​ລະ​ດັບ​ຂອງ​ການ​ສອບ​ເສັງ​ທີ່​ຜ່ານ​ມາ US​. ທີ່ມາ: OpenAI

ຄະແນນຂອງ GPT4 ຈະເຮັດໃຫ້ມັນຢູ່ໃນຕໍາແຫນ່ງທີ່ດີທີ່ຈະເຂົ້າຮຽນໃນໂຮງຮຽນກົດຫມາຍສູງສຸດ 20 ແລະມີພຽງແຕ່ຈໍານວນຫນ້ອຍຂອງຄະແນນທີ່ລາຍງານທີ່ຈໍາເປັນສໍາລັບການຍອມຮັບກັບໂຮງຮຽນທີ່ມີຊື່ສຽງເຊັ່ນ Harvard, Stanford, Princeton ຫຼື Yale.

ຮຸ່ນກ່ອນຂອງ ChatGPT ພຽງແຕ່ໄດ້ຄະແນນ 149 ໃນ LSAT ທີ່ເຮັດໃຫ້ມັນຢູ່ໃນລຸ່ມ 40%.

GPT-4 ຍັງໄດ້ຄະແນນ 298 ຈາກ 400 ໃນການສອບເສັງ Uniform Bar Exam - ການທົດສອບທີ່ດໍາເນີນໂດຍນັກສຶກສາກົດຫມາຍທີ່ຈົບການສຶກສາບໍ່ດົນມານີ້ອະນຸຍາດໃຫ້ພວກເຂົາປະຕິບັດເປັນທະນາຍຄວາມຢູ່ໃນເຂດປົກຄອງຂອງສະຫະລັດ.

ຄະແນນ UBE ຈໍາເປັນຕ້ອງໄດ້ຮັບການຍອມຮັບໃນການປະຕິບັດກົດຫມາຍໃນແຕ່ລະເຂດປົກຄອງຂອງສະຫະລັດ. ທີ່ມາ: ກອງ​ປະ​ຊຸມ​ແຫ່ງ​ຊາດ​ຂອງ​ນັກ​ສອບ​ເສັງ​ທະ​ນາຍ​ຄວາມ​

ຮຸ່ນເກົ່າຂອງ ChatGPT ໄດ້ຕໍ່ສູ້ໃນການທົດສອບນີ້, ຈົບລົງຢູ່ລຸ່ມສຸດ 10% ດ້ວຍຄະແນນ 213 ຈາກທັງໝົດ 400 ຄະແນນ.

ສໍາລັບ SAT Evidence-Based Reading & Writing and SAT Math exams taken by US high school students to measure their college ready, GPT-4 scored in the 93rd and 89th percentile ຕາມລໍາດັບ.

GPT-4 ດີເລີດໃນວິທະຍາສາດ "ຍາກ" ເກີນໄປ, ປະກາດໄດ້ດີກວ່າຄະແນນສະເລ່ຍຂອງ AP Biology (85-100%), ເຄມີສາດ (71-88%) ແລະຟີຊິກ 2 (66-84%).

ຜົນການສອບເສັງຂອງ GPT-4 ແລະ GPT-3.5 ໃນຂອບເຂດຂອງການສອບເສັງສະຫະລັດທີ່ຜ່ານມາ. ແຫຼ່ງຂໍ້ມູນ: OpenAI.

ຢ່າງໃດກໍຕາມ, AP Calculus ຄະແນນຂອງຕົນແມ່ນຂ້ອນຂ້າງສະເລ່ຍ, ຈັດອັນດັບໃນ 43r ຫາ 59 ເປີເຊັນ.

ພື້ນທີ່ອື່ນທີ່ GPT-4 ຂາດແມ່ນໃນການສອບເສັງວັນນະຄະດີພາສາອັງກິດ, ປະກາດຄະແນນໃນສ່ວນຮ້ອຍທີ 8 ຫາ 44 ໃນສອງການທົດສອບແຍກຕ່າງຫາກ.

OpenAI ກ່າວວ່າ GPT-4 ແລະ GPT-3.5 ໄດ້ທົດສອບເຫຼົ່ານີ້ຈາກການສອບເສັງພາກປະຕິບັດ 2022-2023, ແລະວ່າ "ບໍ່ມີການຝຶກອົບຮົມສະເພາະ" ໄດ້ຖືກປະຕິບັດໂດຍເຄື່ອງມືປະມວນຜົນພາສາ:

"ພວກເຮົາບໍ່ໄດ້ຝຶກອົບຮົມສະເພາະສໍາລັບການສອບເສັງເຫຼົ່ານີ້. ສ່ວນນ້ອຍຂອງບັນຫາໃນການສອບເສັງແມ່ນເຫັນໄດ້ຈາກຕົວແບບໃນລະຫວ່າງການຝຶກອົບຮົມ, ແຕ່ພວກເຮົາເຊື່ອວ່າຜົນໄດ້ຮັບແມ່ນເປັນຕົວແທນ.”

ຜົນໄດ້ຮັບເຮັດໃຫ້ເກີດຄວາມຢ້ານກົວໃນຊຸມຊົນ Twitter ເຊັ່ນກັນ.

ທີ່ກ່ຽວຂ້ອງ: ChatGPT ຈະມີຜົນກະທົບແນວໃດຕໍ່ພື້ນທີ່ Web3? ຄໍາຕອບອຸດສາຫະກໍາ

Nick Almond, ຜູ້ກໍ່ຕັ້ງ FactoryDAO ບອກ ຜູ້ຕິດຕາມ Twitter ຂອງລາວ 14,300 ຄົນໃນວັນທີ 14 ມີນານີ້ວ່າ GPT4 ຈະ "ຢ້ານຄົນ" ແລະມັນຈະ "ພັງລົງ" ລະບົບການສຶກສາທົ່ວໂລກ.

ອະດີດຜູ້ອໍານວຍການ Coinbase, Conor Grogan, ກ່າວວ່າລາວໄດ້ໃສ່ສັນຍາສະຫມາດ Ethereum ສົດໆເຂົ້າໄປໃນ GPT-4 ແລະຊີ້ໃຫ້ເຫັນເຖິງ "ຄວາມອ່ອນແອດ້ານຄວາມປອດໄພ" ທັນທີທັນໃດແລະໄດ້ອະທິບາຍວ່າລະຫັດສາມາດຖືກຂູດຮີດແນວໃດ:

ການກວດສອບສັນຍາ smart ກ່ອນຫນ້ານີ້ໃນ ChatGPT ພົບວ່າຮຸ່ນທໍາອິດຂອງມັນຍັງສາມາດສັງເກດເຫັນຂໍ້ບົກພ່ອງຂອງລະຫັດໃນລະດັບທີ່ສົມເຫດສົມຜົນເຊັ່ນດຽວກັນ.

Rowan Cheung, ຜູ້ກໍ່ຕັ້ງຂອງຈົດຫມາຍຂ່າວ AI "The Rundown" ແບ່ງປັນວິດີໂອຂອງ GPT ຖ່າຍທອດເວັບໄຊທ໌ປອມທີ່ແຕ້ມດ້ວຍມືໃສ່ເຈ້ຍເປັນລະຫັດ.