[엔젤스팀]이과생을 위한 현실적 배치표 The prism 실채점 1판 + 석차 및 커트라인 추정의 수리적 근거
“엔젤스 컨설팅 팀의 석차 및 커트라인 추정의 수학적 근거”
The Prism 실채점 2.0판에 붙여
수능시험 성적이 발표되고 전국 누적 석차백분위 (이하 누적석차, 누적) 에 관하여 추정하는 방법은
크게 두 가지가 있습니다.
저희 엔젤스 컨설팅팀은
(1)표본에 의한 귀납적 추정과 함께
(2)반드시 이를 검증할 수 있는 연역적 추정을 개발하여 교차 검증하고 있습니다.
아래와 같은 추정 기법에 의하여 저희는 다음과 같은 효과를 얻을 수 있고, 항상 얻어 왔습니다.
수능 성적이 발표되자마자 표준점수 합에 의한 상위누적 1% 구간 추정
상위누적 1% 구간 추정을 바탕으로 다른 함수를 아래와 똑같이 만들어 상위누적 0.2%, 0.5%, 2.2%, 3.3% 등의 표점합에 의한 석차 구간 추정
이러한 상위누적별 구간 추정을 서로 연결하여 또다른 함수로 만들고,
3의 결과에 따라 만들어진 함수에 대학별 반영비율을 곱하여 생겨난 서로 다른 함수들을 서로 비교
위 1~4의 과정들 가운데 가장 핵심이 되는 제1번째 과정, 즉 ‘난도함수’ 에 대한 과정을 엔젤스 컨설팅팀 연구실에서 아래와 같이 공개합니다. 수능에 관련한 ‘입시통계’ 에, 적어도 저희 엔젤스 팀은 현존 활동하는 팀들 가운데, 저희가 가진 추정 능력과 기술에서는, 일부는 ‘유일’하고, 대부분 독보적인 수리적 근거를 가지고 있으며, 추정 결과에 약간의 오류가 있다하더라도 아래와 같은 수리적 근거에 의해 가장 먼저 신속하게 보정할 수 있다고 자부합니다.
엔젤스 컨설팅 팀 데이터팀 드림
난도함수에 관하여
수능에서 원점수를 그대로 반영하지 않고 표준점수를 사용하는 이유는 ‘선택과목별 난이도’나 ‘각 과목을 선택한 학생집단의 학력 수준’과 같은 특징들을 반영하여 점수를 교정해야 하기 때문입니다. 그래야 형평성에 관한 논란이 생기지 않지요. 이번 수능에서 활용하고 있는 국어와 수학의 조정원점수는 형평성 확보를 위한 더 적극적인 점수 교정 방법이라 할 수 있습니다.
이렇게 원점수를 표준점수로 변환한다는 것은 ‘절대평가’ 점수인 원점수를 ‘상대평가’ 점수로 바꾼다는 의미이고, 이는 곧 ‘내 과목 점수’가 아닌 ‘과목 내에서의 내 석차’가 반영된다는 의미로도 해석될 수 있습니다.
먼저, 다음과 같이 설정해 봅시다.
• 국어 1컷 표준점수 x
• 수학 1컷 표준점수 y (자연 : 미적분학 1컷 표준점수 / 인문 : 확률과통계 1컷 표준점수)*
• 탐구 1컷 점수 z(탐구영역 과목별 1컷 표준점수 평균을 2배한 점수)
• w=x+y+z
*기하는 누적석차에 영향을 끼치기에는 너무 모집단이 적음, 미적분으로 간주하고 계산
w는 각 과목별 1등급 컷 표준점수의 합(이하, 1컷표점합)입니다. 시험이 쉬울 경우 이 점수는 높아지고, 반대로 시험이 쉬우면 이 점수는 낮아집니다.
그리고 누적석차 1%에 해당하는 국수탐 표준점수합의 합(이하, 1%표점합)을 s라 하면,
s의 크기 또한 시험이 쉬울 경우 높아지고, 시험이 어려울 경우 낮아지게 됩니다.
다음은 이전 A, B, C학년도의 실제 수능 시험 결과를 활용하여 w와 s를 구한 것입니다.
*[아래의 점수는 편의상 원점수로 작성되어 있는데, 그 이유는 이 글을 작성할 때는 표준점수 값을 몰랐기 때문임. 실제로 활용되는 것은 아래의 원점수들에 해당하는 표준점수 합의 값들의 평균값]
국수탐 1컷표점합(w) | 국수탐 1%표점합(s) | t(=s-w) | |
A학년도(쉬운 수능) | 285 | 287 | 2 |
B학년도(보통 수능) | 275 | 281 | 6 |
C학년도(어려운 수능) | 255 | 279 | 24 |
위 표에서 흥미로운 사실을 한 가지 발견할 수 있습니다.
시험이 쉬울 경우 1%표점합(s)과 1컷표점합(w)의 차이는 매우 작고, 시험이 어려울수록 두 점수의 차이가 급격하게 커지게 됩니다.
그도 그럴 것이 시험이 쉬울 경우에는 상위권 학생의 점수가 매우 촘촘하게 배열되기 때문에 두 점수 차이는 매우 작아지고, 시험이 어려워질수록 상위권과 최상위권, 극상위권 학생들 간의 점수 차이가 급격하게 벌어지기 때문에 두 점수의 차이가 매우 커질 것이라는 점은 쉽게 예상할 수 있는 바입니다.
표의 네 번째 열에 나와 있는 1%표점합과 1컷표점합의 차이, 즉 (s-w)의 값을 t라 합시다.
이 t값은 매우 중요한 의미를 갖습니다. 왜냐하면 1컷표점합은 평가원의 발표를 통해 알 수 있지만 1%표점합은 그럴 수가 없기 때문입니다.
하지만 우리가 이 t값을 알아낼 수만 있다면 1%표점합을 알아낼 수 있습니다.
그렇다면 t값을 어떻게 알아낼 수 있을까요?
얼핏 보아 명확히 알 수는 없겠지만 w와 t 사이에 일정한 관계가 존재할 수도 있습니다.
만약 이 관계가 존재한다면 그것을 다음과 같은 함수로 표현할 수 있습니다.
t=f(w)
함수 f가 구체적으로 무엇인지 명확히 알 수는 없지만
일단 다음 그림과 같이 우하향하는 함수임에는 분명합니다.
그래프의 형태로 보아 f는 유리함수일수도 있고, 지수함수일 수도 있고, 또 다른 우하향하는 함수일 수도 있습니다.
과거 수능 데이터들를 분석해 보면
함수 f가 다음과 같이 밑이 자연상수(e)인 지수함수로 표현됨을 어렵지 않게 알아낼 수 있습니다.
t=f(w)=e^(aw+b) + c (e=2.7182⋯)
이 함수 f를 난도함수라 부르기로 합시다.
이렇게 부르는 이유는 이 함수에 의해 결정되는 값인 t가 시험의 난도에 따라 크게 영향을 받기 때문입니다.
유의할 점은 이 함수는 경험적 추론에 의해 만들어진 함수라는 사실입니다.
이 함수는 결코 어떤 연역적 논리에 의해 만들어진 확정적인 관계식이 아닙니다.
이 함수는 경험적으로 축적된 데이터들을 통해 파악된 귀납적 결과에 불과합니다.
따라서 이 함수를 통한 추론 결과에는 반드시 일정 수준의 오차가 포함되어 있을 수 밖에 없습니다.
이렇게 오차의 여지가 있음에도 불구하고 이 함수가 유용한 이유는
현재 우리가 활용하고 있는 누적석차들 모두 경험적 표본을 토대로 산출되는 결과이기 때문입니다.
현재 많은 분들께서 참고하시는 E사기준, GS기준, 그리고 칼레(오르비/kaleidoscope)기준의
세 가지 석차백분위(누적석차)가 가장 많이 활용되고 있습니다.
이 누적석차 또한 애초 평가원의 원데이터를 통해 추론된 값이 아니라
"확보된 표본 가운데 몇 %가 전체 몇 %"라고 하는 귀납적 추정를 통해 산출된 값입니다.
오랜기간 동안 누적석차의 표준으로 자리매김해 온 E사가 발표했던
과거 누적석차들을 분석해 보면 E사 또한 위에서 설명한 난도함수를 만들어 놓았을 가능성이 높다는 생각이 듭니다.
어쨌든 이들 3사의 추론 결과가 평가원의 원데이터와 비교할 때 얼마 만큼의 오차를 가지고 있는지는 알 수 없습니다.
하지만 이들은 전국의 수험생들이 참조하는 자기 위치 파악의 기준으로 오랫동안 기능해 왔기 때문에
평가원의 원데이터가 어떠한지와는 관계 없이 사실상 진짜 누적석차가 되어 버렸습니다.
대학을 지원할 때 대부분의 수험생이 믿고 참고하는 누적석차가 현실적으로는 진짜 누적석차가 될 수밖에 없습니다.
설령, 누군가가 평가원의 원데이터를 빼내 실제 누적석차를 구하여 공개한다고 해도
수험생들이 그것을 믿고 활용하지 않는다면 의미가 없습니다.
E사 기준으로 0.3%인 학생이 실제 원데이터 기준으로는 0.58%라 하더라도
모든 수험생들이 E사 기준을 믿고 대학에 지원한다면
이 학생은 0.3%가 합격할 수 있는 대학에 실제로 합격할 수 있기 때문입니다.
(“그렇다면 11년도나 14년도에 있었던 누적석차 추정 실패는 무엇인가?” 하고 물으실 수도 있지만, 그것은 3개 이상의 회사가 서로 다른 누적석차를 발표해서 서로 다른 누적석차를 학생들이 혼용하여 일어난 일이라고 보는 것이 타당합니다. 그런 경우라면 보다 객관적으로 원 데이터에 가장 근접한 석차 대신에, 원 데이터보다 많이 괴리가 있는 석차가 더 많이 쓰인다면 입시에 큰 비극적 결과가 나오게 됩니다. 하지만 틀린 누적석차 하나를 모두 쓸 때는 그러한 일이 일어나지 않습니다.)
다시 본래 논의로 돌아가서
우리가 입시사이트에서 13년째 사용하고 있는 누적석차의 근간이 바로 위에서 설명한 난도함수, f(w)입니다.
함수의 input 값인 w는 평가원이 공개하는 각 과목별 1컷 점수이기 때문에
이 함수를 통해 우리는 평가원의 성적 발표 후에
신속하게 최상위 누적석차 기준 점수인 1%의 과목별 표준점수 합을 추론할 수 있습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
전공수업같네요
안녕하세요. 엔젤스 팀 탈론입니다.
프리즘 해석법의 경우 가채점 버전으로 저희가 써둔 게시글을 참고해주세요. https://i.orbi.kr/00041344706
유용한 데이터 잘 봤습니다
표점합으로만 보면 생각했던 누백보다 좀 더 밀리네요
처음 예상보다 고득점자들이 많나보네요 헐
탐구가 죄다불이라 전과목 다 표점이 높아진 이유도 있겠네요
극상위권들은 아무리 어려워도 다들 잘보네요 ㅋ
올해 수능에서 특이한 점은 수학에서 기존 불 수능과 다르게 상위권과 그 아래의 격차가 심해진 것이라 더 그렇게 느끼셨을거같습니다. 하지만, 조금 더 표본분석등을 열심히 하면 충분히 자기 갈 학교 찾으실 수 있을겁니다
2022 환산 점수는 타사이트들이 내놓은 점수로 봐도 될까요? 아니면 다시 계산해야하나요?
표점이 나오고 나서, 점수라면 어디라도 탐구 영역에서의 이상하게 한 보정을 한 곳이 만약 있다면 그곳을 제외하곤 저희랑 같은 점수가 나올겁니다.
컨설팅 예약했는데, 미리 점수를 제출하거나 해야되나요?
안녕하세요 엔젤스 팀입니다. 추후 문자로 안내갈 예정이지만 쪽지 참고해주세요.
감사합니다 혹시 컨설팅 전 라인이나 몇가지 질문사항이 있으면 어디로 물어보면 될까요?
teamangels16@gmail.com 으로 문의 부탁드립니다.
근데 이거 맞긴 함? 존나 짜보이는데
Angels 배치기준의 경우 임의적인 값을 부여하기보단, 현재 시중에 풀려 있는 자료등을 총체적으로 고려했습니다.
올해의 경우 미적+기하 응시자가 예년에 비해 많아졌기때문에 상대적으로 짜보이는 착시효과가 나타난거같습니다.
추후 버전에선 조금 더 수정 보완될거같습니다. 감사합니다.
근데 낙.지, 고.속이랑 이렇게 차이날 수 있나요??
내 점수가 특이한 건가
공개된 곳에 점수를 적으시긴 어려우실테니, 쪽지나 이메일 (teamangels16@gmail.com) 로 점수 또는 궁금하신 부분을 보내주시면, 좀더 자세한 분석을 도와드리겠습니다. 저희도 꾸준히 교차검증을 진행 중이니, 내용 보내주시면 도움이 될 것 같습니다.
이런 식이라면, 쉬울 땐 후하게 잡히고 어려울 땐 짜게 잡힐 것 같습니다 다른 업체들도 다 이와 같은 방식을 취하는 거 같던데, 각 과목의 난이도에 따른 골고루 잘 봤는가 골고루 평이하게 봤는가 등을 계량적으로 따로 분석하시나요? 아니면 그냥 오차항으로만 보시고 선형적으로만 분석하시는건가요?
말씀하신대로 선형적인 분석만으로는 완벽한 추정이 어렵습니다. 저희가 서성한 라인까지만 프리즘을 제시한 것도, 의미있는 추정이 가능한 라인이 여기까지라고 생각했기 때문입니다. 올해처럼, 많은 학생들이 주로 시험을 치르는 과목들이 평년보다 어려운 경우에는, 위치가 아닌 점수로 봤을 때 상위권의 밀도가 낮아보이는 경향이 생길 수 있습니다. 이 부분은 실제 입시과정에서 표본분석을 통해 보완, 컨설팅에 반영되게 됩니다.
다원 엔젤스팀 예약 했는데 같은 팀인가요?
협력관계라고 생각해주시면 될 것 같습니다. 엔젤스팀은 오르비에서만 활동합니다.
잘 읽었습니다. 그런데 난도함수를 구하기 위해서는 전년도 1%의 표준점수 합이 필요할 것 같은데, 이것은 어떻게 구했나요? 올해 1% 표준점수 합을 알기 위해서 그 전년도 1% 표준점수 합이 필요하다면 순환 논증처럼 빙빙 돌 것 같은데요...
말씀하신거처럼 1%의 표준 점수 합은 평가원에서 제공하고 있지 않습니다. 하지만, 흔히들 수험생 여러분들이 사용하시는 G사식이나 E사 식 J 사 식등을 통해 역산했다고 봐주시면 될거같습니다.
아 그렇군요 기본 바탕은 다른 회사의 추정을 가지고 한 것이네요. 그럼에도 새로운 추정을 해보려고 노력하신 부분 대단하다고 생각합니다. 저도 통계학에 관심이 많아서 여쭤봤습니다. 민감할 수도 있는 질문이었는데 답해주셔서 감사합니다.
아닙니다 좋은 질문과 좋게 봐주셔서 감사합니다 :)
난도함수가 지수함수꼴인게 진짜 신기하네요 ㅋㅋㅋㅋ
이런 영업비밀을 다 공개하셔도 되나요? ㄷㄷ
읽어주셔서 감사합니다. 영업비밀이라기보다는, 관점의 공유로 생각하고 글 쓰게 되었습니다.
중대도 올려주세요 ㅠㅠㅠ
꾸준히 업데이트 해보겠습니다. 감사합니다.
이게 지금 반응이 짜게 잡히는거 같다는데 서울대는 지금 성적표만으로도 정확하게 서울대식 점수를 계산할 수있잖아요... 그럼 설대식 398점만 맞아도 식물생산정도를 갈수 있다고 보는게 맞나요?? 그렇게 짜지는 않은것 같은데...?
좌측에 표시된 의치한 부분 같은경우에는 각 학교별로 상이한 반영비식이 작용되어서, 일부 점수 조합에선 짜게 보일 수도 있습니다. 또한 배치점수같은 부분은 단순히 저희가 생각하는 default 값이 아니라 시중에 풀린 여러 자료를 참고해서 값을 부여한거라 나중에 바뀔 수도 있습니다.
왜 2022 서울대는 비공개인가요?
추후 업데이트 예정입니다. 감사합니다.
감사합니다.
1. 한의대 계열도 업뎃 예정이신지 궁금합니다.
2. 현재 확정된 성적에 따른 백분위 퍼센테이지를 M사 추정치로 하는 중인데, 그걸 그대로 믿고 가야하는지 궁금합니다.
3. 저 같은 경우 백분위 기준 학과하고 대학별점수에 따른 배치의 매치가 안맞는데, 대학별점수의 관점을 따르는 것이 맞는지 궁금합니다.
1. 한의대의 경우 내부 협의중입니다.
2. 백분위 퍼센테이지가 누적 백분위를 말씀하시는거라면 사람들이 젤 많이 쓰는 회사인 J, E사 백분위나 개인이 만든 G로 시작하는 백분위를 사용하시길 추천합니다.
3. 저희 기준으로 백분위 기준 학과 점수를 어떻게 알아내신지는 모르겠지만 표준점수 기반으로 계산하시는게 바람직하다고 생각합니다.
엉엉..1탐구 한의대 하나 기대중이긴 한데…최대한 기대해봐도 되겠습니까….!!
표점 기준 퍼센테이지가 상위권 학교 및 학과 기준으로 백분위 기준보다 더 정확하다고 할 수 있다는 건가요?
1. 1탐구의 경우 특수한 케이스라 저희 프리즘으로 나타내기에 제약 요소가 많아서, 표본 분석이나 향후 데이터를 바탕으로 생각하셔야합니다.
2. 학교마다 다른 반영식을 가지고 있지만, 많은 학교가 누백을 표점 기준으로 산출하기 때문에 그 학교들은 표점기준으로 생각하시되, 백분위 반영대학의 경우 백분위 기준으로 그 학교를 위해 만들어진 식으로 보셔야합니다.
3. 각 학교마다 사실상 같은 성적을 가지고도 누적 백분위가 갈라진다는것을 아시고 접근하세요.
성대 반도체학과도 나중에 추가될까요?
내부 협의 후 어느정도 객관성을 가지고 표시할만하다고 생각하면 업로드 해드리겠습니다.
감사합니다 선생님 ㅠ
전국석차 백분위로 가능 대학라인 보면 되는건가요??
안녕하세요 엔젤스 탈론입니다.
먼저 프리즘 사용법의 경우 https://i.orbi.kr/00041344706 를 참고해주시면 감사할거같습니다.
기본적인 아이디어는 동일합니다.
특정 성적으로 각 대학별 변환 식을 도출해내고
그 식의 유불리를 직관적으로 파악하게 됨과 동시에 그 대학에서 내가 어느정도 위치가 되는지를 파악하고자 만들었습니다.
오잉 짜게 잡힌거면 저기 해당성적이면 될 확률이 높은가요
안녕하세요. 엔젤스 탈론입니다.
주요 기관 발표치와 비교했을때 저희는 짜게 잡았다고 생각은 안드는데, 어떻게 생각하시는지에 따라 다를거같습니다. 이 부분은 추후 공개 버전에서 수정/보완해가면서 격차를 줄이도록 하겠습니다.
사실 저희 프리즘이 만들어진 이유는 특정 학과에 대한 가능성을 언급하기보다, 정시 지원 전략에 있어서 유불리와 내가 현실적으로 노릴만한 학과가 어느 곳인지 판단하실때 도움이 되길 바라며 제작되었습니다.
예를들어 연세대식보다 고대식이 되는 과가 더 많다면 고대를 타게팅 하게 만들어주자라는 목적으로 생각하시고 표본분석 전에 원서에 있어서 이런 관점으로 접근하시면 될거같습니다.
앗 넵 감사합니다 완전 끝자락 성적이라 쫄리네요 ㅠㅠ 최종컷 기준으로 잡아주신건가요
넵 기본적으로 최종 컷 추정을 바탕으로 작성되었지만, 아직 초반부이기때문에 참고만 하시길 바라겠습니다.
지2 선댁자고 서울대 상위학과 희망하는 학생입니다...소수점까지 다퉈야하는 데 생2 판결이 났을 때 다른 탐구 선택자들에게 끼칠 영향이 어떨지 조언을 구하고 싶습니다ㅜㅜㅜ
생 2의 건의 경우, 아직 서울대 상위과의 경우 가장 많이 사용하시는 표본회사의 경우 "생2"선택자의 표본이 유입 안된걸로 알고 있습니다. 현재는 분모와 분자가 다 동일한 상태라면 생 2 소송의 원고 측 승과 패에 따라 분모와 분자에 미치는 영향이 다를것이라, 지금 있는 그대로 분석하고 해석해 주시되, 추후에 어차피 데이터가 반영될 것이기 때문에 걱정안하셔도 될것입니다.
답변 감사합니다!
부디 손해 보는 측 없이 최선책으로 해결 되길 희망해요~~~
한양대 나름 후하게잡으신건가요?? 아니면 현실적인 컷예상인건가요?
최대한 후하거나 짜지 않고, 현실적으로 잡을려고 노력했습니다만 아직 원서 영역 초기라 조금씩 오차를 줄여나가겠습니다.
고려대 환생공,건축공학과(낮은공대)와 자연과학계열이 겹칠가능성이 높나요??
생명과, 생명공, 지구과학계열은 개인의 선호에 따라 지원하는 경향이 있어서 컷이 비슷해집니다. 자연대 주요과 (수학/물리/화학)은 건축공계열보다 높은 경우가 있는데, 항상 그렇지만은 않습니다. 많이 접하실 소위 80%컷 등의 기준에 따른다면, 이대로 순서를 매길 수 있을거같습니다.
혹시 오차가 나신 구간이 메디컬 구간인 경우, 저희가 모든 메디컬 라인 반영식의 유불리를 반영한 것이 아니라, 특정 대학 위주의 누백이라 받으신 점수에 따라 누백이 달라질 수 있습니다.
혹시 이외의 오류이라시라면 언제든 오류 제보해주세요!
혹시 카이스트는 어떻게 될까요...?
카이스트의 경우 정시 원서 영역에서 특수성을 생각했을때 조금 더 상황을 지켜봐야하지 않나 생각이 듭니다.
연세대 산업공학 컴퓨터 합격구간을 700부터 잡으셨는데 빵꾸를 예상하시는 건가요?? 예상하신다면 정확한 이유도 궁금합니다 이 두가지 과 스나를 노려보는 중이라..
안녕하세요. 저희가 이곳에 정확한 이유를 적게 된다면, 그로 인해 저희의 예측이 틀려지게 되는 결과가 발생합니다. 두 학과 모두 반드시 저런 결과가 나온다는 것은 아니며, 지원이 의미 있는 점수의 범위를 예측한 것임을 감안해 주시기 부탁드립니다.