알고나면 별 거 아니지만 처음 알았을 땐 "이런 것도 된다고?" 하고 놀란 R 기능 중의 하나가 명령어를 통해 폴더 내 파일을 자동으로 다른 폴더로 옮기거나 삭제하는 기능. 빅데이터를 다루다 보면 어마어마한 용량의 자료를 어떻게든 처리하기 위해 자료를 일괄적으로 옮기거나 삭제하거나 하는 일이 필요해진다. 때문에 필요해져서 학습한 명령어를 정리해봤다. 1. 폴더 내 파일을 다른 폴더에 복사하기 (Copy file lists to another folder) > filename filename> file.copy(filename, "파일을옮길경로") 위의 명령어를 통해 지정한 폴더에서 pattern이란 이름으로 시작하고 .xlsx 유형인 파일들의 파일명을 filename 오브젝트에 저장한다. file.cop..
간혹 R에서 작업하다가 저장한 자료를 SAS에서도 불러들여 작업을 하려고 할 때 문제가 발생하곤 한다.보통 교재나 인터넷 글들을 보면 R에서는 결측값(missing value)을 NA로 인식하기 때문에 NA로 자주 편집하는 걸 보게 된다. 그런데 기본적으로 연속형 변수(numeric variable)에 대해 NA 처리를 하면 R은 이 값을 missing으로 인식하지만, SAS 같은 다른 프로그램에선 변수 유형을 파악 할 때 충돌이 발생한다. SAS는 한 변수가 연속형 변수인 경우 그 변수에 대해서는 NA 라는 문자(character)를 입력할 수 없게 된다.만약 이렇게 만들어져 있는 변수를 제대로 읽기 위해서는 option을 지정해서 NA 가 misisng임을 SAS가 인식할 수 있게 해줘야 하지만, 명..
통계분석에서 x, y 의 회귀 분석 시, z라는 제 3의 변수의 교호작용(Interaction) 유무를 검증하고자 할 때, 많은 저자들이 연속형 변수 z를 그룹형 변수로 바꾸는 방법을 시도 한다. 나아가서 x와 z 모두 그룹화하여 n x n 테이블을 만들어 z 변수에 의한 interaction의 유무를 가늠하기도 한다. 그러나 이러한 접근법은 z 변수에 실제로는 교호작용이 없음에도 불구하고 교호작용이 있는 것 처럼 보일 수 있다(spurious interaction). 또한 interaction term 의 partial regression coefficient 의 값이 0 이라고 하는 귀무가설이 참임에도 불구하고 그 가설을 기각해버리는 제 1종 오류를 범할 가능성을 증가시킬 수 있다. 제 1종 오류는 ..
Greetings.This page introduces the research experience of SK, which is on the card you are holding now. Thank you for your visiting.Hope to see you soon again. PUBLICATIONS WORKS IN PROGRESS “Long-term changes in the heat-mortality relationship according to heterogeneous regional climate: a time-series study.” First author. 2016 (under review) PEER REVIEWED ORIGINAL RESEARCH First authourDisease..