본문 바로가기
Somnology/Data

NSRR Ruby Gem (1)

by goatlab 2022. 5. 18.
728x90
반응형
SMALL

NSRR Ruby Gem

 

 

National Sleep Research Resource에 대한 파일 다운로드 및 데이터 세트 통합 작업을 단순화하기 위해 구축된 공식 Ruby Gem이다.

 

 

다음 명령은 Windows의 명령 프롬프트와 Mac OS X의 터미널 에서 실행할 수 있다. 다음과 같이 직접 설치한다.

 

gem update --system --no-document 
gem install bundler --no-document
gem install nsrr --no-document

 

 

데이터세트에서 파일 다운로드

 

(Ctrl-C 명령을 다시 입력하여 다운로드를 일시 중지하고 나중에 다시 시작하려면 입력할 수 있다.)

 

전체 데이터세트를 다운로드

 

nsrr download shhs

 

데이터세트의 하위 폴더를 다운로드

 

nsrr download shhs/forms

 

하위 폴더의 내용을 다운로드하지 않고 폴더를 다운로드. 기본적으로 지정하지 않으면 명령은 지정된 폴더와 하위 폴더의 모든 내용을 재귀적으로 다운로드.

 

nsrr download shhs/datasets --shallow

 

진행 중인 다운로드를 계속하고 파일 크기만 비교한다. 기본적으로 다운로드한 파일이 이미 존재하는 경우 명령은 MD5 파일 비교를 수행하여 파일이 서버에 있는 파일과 동일한지 확인한다. MD5 비교는 정확하지만 구형 시스템에서는 느릴 수 있다. 빠른 확인을 원하면 명령에 단순히 로컬 파일의 파일 크기와 서버의 파일을 비교하도록 지시하여 비교 프로세스의 속도를 높일 수 있지만 경우에 따라 정확하지 않을 수 있다.

 

nsrr download shhs --fast

 

모든 파일을 다시 다운로드하고 기존에 다운로드한 파일을 덮어쓴다.

 

nsrr download shhs --fresh

 

파일 검사 플래그를 폴더 깊이 플래그와 결합할 수도 있다.

 

nsrr download shhs/datasets --shallow --fast

 

다운로드한 파일을 필터링하는 정규식을 지정할 수 있다.

 

nsrr download nchsdb/health_data --file="^PROCEDURE.*\.csv$"
      create nchsdb/health_data/
     skipped DEMOGRAPHIC.csv
     skipped DIAGNOSIS.csv
     skipped ENCOUNTER.csv
     skipped MEASUREMENT.csv
     skipped MEDICATION.csv
  downloaded PROCEDURE.csv
  downloaded PROCEDURE_SURG_HX.csv
     skipped SLEEP_ENC_ID.csv
     skipped SLEEP_STUDY.csv
     skipped Sleep_Study_Data_File_Format.pdf
 
728x90
반응형
LIST

'Somnology > Data' 카테고리의 다른 글

NSRR (National Sleep Research Resource)  (0) 2022.05.19
NSRR Ruby Gem (2)  (0) 2022.05.18
Sleep AI  (0) 2022.05.06
AI Hub  (0) 2022.05.06
EDF (European Data Format)  (0) 2022.04.14