ChatGPT V4 aces ແຖບ, SATs ແລະສາມາດກໍານົດການຂູດຮີດໃນສັນຍາ ETH

GPT-4, ຮຸ່ນຫຼ້າສຸດຂອງ Artificial Intelligence (AI) chatbot, ChatGPT, ສາມາດຜ່ານການສອບເສັງຊັ້ນສູງແລະການສອບເສັງໂຮງຮຽນກົດຫມາຍດ້ວຍຄະແນນການຈັດອັນດັບໃນອັດຕາສ່ວນຮ້ອຍລະ 90 ແລະມີຄວາມສາມາດປະມວນຜົນໃຫມ່ທີ່ບໍ່ເປັນໄປໄດ້ກັບຮຸ່ນກ່ອນ.

ຕົວເລກຈາກຄະແນນການທົດສອບຂອງ GPT-4 ໄດ້ຖືກແບ່ງປັນໃນວັນທີ 14 ເດືອນມີນາໂດຍຜູ້ສ້າງ OpenAI ເປີດເຜີຍວ່າມັນຍັງສາມາດປ່ຽນຮູບພາບ, ສຽງແລະວິດີໂອເຂົ້າໃນຂໍ້ຄວາມນອກເຫນືອຈາກການຈັດການ "ຄໍາແນະນໍາທີ່ລະອຽດອ່ອນຫຼາຍ" ສ້າງສັນແລະເຊື່ອຖືໄດ້.

"ມັນຜ່ານການສອບເສັງແຖບ simulated ດ້ວຍຄະແນນປະມານ 10% ຂອງຜູ້ສອບເສັງ," OpenAI ເພີ່ມ. "ໃນທາງກົງກັນຂ້າມ, ຄະແນນຂອງ GPT-3.5 ແມ່ນປະມານລຸ່ມສຸດ 10%.

ຕົວເລກສະແດງໃຫ້ເຫັນວ່າ GPT-4 ບັນລຸໄດ້ຄະແນນ 163 ໃນສ່ວນຮ້ອຍ 88 ໃນການສອບເສັງ LSAT — ນັກສຶກສາວິທະຍາໄລການທົດສອບຈໍາເປັນຕ້ອງຜ່ານໃນສະຫະລັດອາເມລິກາເພື່ອເຂົ້າໄປໃນໂຮງຮຽນກົດຫມາຍ.

ຜົນການສອບເສັງຂອງ GPT-4 ແລະ GPT-3.5 ໃນລະດັບຂອງການສອບເສັງທີ່ຜ່ານມາ US. ທີ່ມາ: *OpenAI*

ຄະແນນຂອງ GPT4 ຈະເຮັດໃຫ້ມັນຢູ່ໃນຕໍາແຫນ່ງທີ່ດີທີ່ຈະເຂົ້າຮຽນໃນໂຮງຮຽນກົດຫມາຍສູງສຸດ 20 ແລະມີພຽງແຕ່ຈໍານວນຫນ້ອຍຂອງຄະແນນທີ່ລາຍງານທີ່ຈໍາເປັນສໍາລັບການຍອມຮັບກັບໂຮງຮຽນທີ່ມີຊື່ສຽງເຊັ່ນ Harvard, Stanford, Princeton ຫຼື Yale.

ຮຸ່ນກ່ອນຂອງ ChatGPT ພຽງແຕ່ໄດ້ຄະແນນ 149 ໃນ LSAT ທີ່ເຮັດໃຫ້ມັນຢູ່ໃນລຸ່ມ 40%.

GPT-4 ຍັງໄດ້ຄະແນນ 298 ຈາກ 400 ໃນການສອບເສັງ Uniform Bar Exam - ການທົດສອບທີ່ດໍາເນີນໂດຍນັກສຶກສາກົດຫມາຍທີ່ຈົບການສຶກສາບໍ່ດົນມານີ້ອະນຸຍາດໃຫ້ພວກເຂົາປະຕິບັດເປັນທະນາຍຄວາມຢູ່ໃນເຂດປົກຄອງຂອງສະຫະລັດ.

ຄະແນນ UBE ຈໍາເປັນຕ້ອງໄດ້ຮັບການຍອມຮັບໃນການປະຕິບັດກົດຫມາຍໃນແຕ່ລະເຂດປົກຄອງຂອງສະຫະລັດ. ທີ່ມາ: *ກອງປະຊຸມແຫ່ງຊາດຂອງນັກສອບເສັງທະນາຍຄວາມ*

ຮຸ່ນເກົ່າຂອງ ChatGPT ໄດ້ຕໍ່ສູ້ໃນການທົດສອບນີ້, ຈົບລົງຢູ່ລຸ່ມສຸດ 10% ດ້ວຍຄະແນນ 213 ຈາກທັງໝົດ 400 ຄະແນນ.

ສໍາລັບ SAT Evidence-Based Reading & Writing and SAT Math exams taken by US high school students to measure their college ready, GPT-4 scored in the 93rd and 89th percentile ຕາມລໍາດັບ.

GPT-4 ດີເລີດໃນວິທະຍາສາດ "ຍາກ" ເກີນໄປ, ປະກາດໄດ້ດີກວ່າຄະແນນສະເລ່ຍຂອງ AP Biology (85-100%), ເຄມີສາດ (71-88%) ແລະຟີຊິກ 2 (66-84%).

*ຜົນການສອບເສັງຂອງ GPT-4 ແລະ GPT-3.5 ໃນຂອບເຂດຂອງການສອບເສັງສະຫະລັດທີ່ຜ່ານມາ.* *ແຫຼ່ງຂໍ້ມູນ: OpenAI.*

ຢ່າງໃດກໍຕາມ, AP Calculus ຄະແນນຂອງຕົນແມ່ນຂ້ອນຂ້າງສະເລ່ຍ, ຈັດອັນດັບໃນ 43r ຫາ 59 ເປີເຊັນ.

ພື້ນທີ່ອື່ນທີ່ GPT-4 ຂາດແມ່ນໃນການສອບເສັງວັນນະຄະດີພາສາອັງກິດ, ປະກາດຄະແນນໃນສ່ວນຮ້ອຍທີ 8 ຫາ 44 ໃນສອງການທົດສອບແຍກຕ່າງຫາກ.

OpenAI ກ່າວວ່າ GPT-4 ແລະ GPT-3.5 ໄດ້ທົດສອບເຫຼົ່ານີ້ຈາກການສອບເສັງພາກປະຕິບັດ 2022-2023, ແລະວ່າ "ບໍ່ມີການຝຶກອົບຮົມສະເພາະ" ໄດ້ຖືກປະຕິບັດໂດຍເຄື່ອງມືປະມວນຜົນພາສາ:

"ພວກເຮົາບໍ່ໄດ້ຝຶກອົບຮົມສະເພາະສໍາລັບການສອບເສັງເຫຼົ່ານີ້. ສ່ວນນ້ອຍຂອງບັນຫາໃນການສອບເສັງແມ່ນເຫັນໄດ້ຈາກຕົວແບບໃນລະຫວ່າງການຝຶກອົບຮົມ, ແຕ່ພວກເຮົາເຊື່ອວ່າຜົນໄດ້ຮັບແມ່ນເປັນຕົວແທນ.”

ຜົນໄດ້ຮັບເຮັດໃຫ້ເກີດຄວາມຢ້ານກົວໃນຊຸມຊົນ Twitter ເຊັ່ນກັນ.

ທີ່ກ່ຽວຂ້ອງ: ChatGPT ຈະມີຜົນກະທົບແນວໃດຕໍ່ພື້ນທີ່ Web3? ຄໍາຕອບອຸດສາຫະກໍາ

Nick Almond, ຜູ້ກໍ່ຕັ້ງ FactoryDAO ບອກ ຜູ້ຕິດຕາມ Twitter ຂອງລາວ 14,300 ຄົນໃນວັນທີ 14 ມີນານີ້ວ່າ GPT4 ຈະ "ຢ້ານຄົນ" ແລະມັນຈະ "ພັງລົງ" ລະບົບການສຶກສາທົ່ວໂລກ.

ທິດສະດີການປະເມີນແມ່ນເປັນກ້ອນໃຫຍ່ໃນຊີວິດຂອງຂ້ອຍເປັນເວລາຫຼາຍປີ. ຂ້າພະເຈົ້າໄດ້ banging ກ່ຽວກັບມື້ນີ້ມາຫຼາຍປີກ່ອນຫນ້ານີ້. ຂ້າ ພະ ເຈົ້າ ຮູ້ ຫນັງ ສື sounded ຄື crank ທີ່ ຢູ່ ອາ ໄສ ໃນ ເວ ລາ ນັ້ນ.
ແຕ່... ອັນນີ້ໝາຍຄວາມວ່າອັນໃດອັນໜຶ່ງນອກຈາກການປະເມີນແບບ inviilated ແມ່ນຈົບຈາກຈຸດນີ້ໄປ.
— drnick ️² (@DrNickA) ມີນາ 14, 2023

ອະດີດຜູ້ອໍານວຍການ Coinbase, Conor Grogan, ກ່າວວ່າລາວໄດ້ໃສ່ສັນຍາສະຫມາດ Ethereum ສົດໆເຂົ້າໄປໃນ GPT-4 ແລະຊີ້ໃຫ້ເຫັນເຖິງ "ຄວາມອ່ອນແອດ້ານຄວາມປອດໄພ" ທັນທີທັນໃດແລະໄດ້ອະທິບາຍວ່າລະຫັດສາມາດຖືກຂູດຮີດແນວໃດ:

ຂ້ອຍໄດ້ຖິ້ມສັນຍາ Ethereum ສົດໃສ່ GPT-4.
ໃນທັນທີ, ມັນໄດ້ຊີ້ໃຫ້ເຫັນຈຸດອ່ອນດ້ານຄວາມປອດໄພຈໍານວນຫນຶ່ງແລະຊີ້ໃຫ້ເຫັນພື້ນທີ່ຫນ້າດິນທີ່ສັນຍາສາມາດຖືກຂູດຮີດ. ຫຼັງຈາກນັ້ນມັນໄດ້ຢືນຢັນວິທີການສະເພາະທີ່ຂ້ອຍສາມາດຂຸດຄົ້ນສັນຍາໄດ້ pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) ມີນາ 14, 2023

ການກວດສອບສັນຍາ smart ກ່ອນຫນ້ານີ້ໃນ ChatGPT ພົບວ່າຮຸ່ນທໍາອິດຂອງມັນຍັງສາມາດສັງເກດເຫັນຂໍ້ບົກພ່ອງຂອງລະຫັດໃນລະດັບທີ່ສົມເຫດສົມຜົນເຊັ່ນດຽວກັນ.

Rowan Cheung, ຜູ້ກໍ່ຕັ້ງຂອງຈົດຫມາຍຂ່າວ AI "The Rundown" ແບ່ງປັນວິດີໂອຂອງ GPT ຖ່າຍທອດເວັບໄຊທ໌ປອມທີ່ແຕ້ມດ້ວຍມືໃສ່ເຈ້ຍເປັນລະຫັດ.

ຂ້າພະເຈົ້າພຽງແຕ່ເບິ່ງ GPT-4 ຫັນຮູບແຕ້ມທີ່ແຕ້ມດ້ວຍມືເຂົ້າໄປໃນເວັບໄຊທ໌ທີ່ເປັນປະໂຫຍດ.
ນີ້ແມ່ນບ້າ. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) ມີນາ 14, 2023