Lesson3 web python lab review default

이것은 SAT 3310입니다 우리는 웹 및 네트워크 및 파이썬 이것은 들어가는 예제 랩의 리뷰입니다

텍스트 파일을 다운로드 구문 분석은 텍스트 파일을 희망하고 다음에 가서 텍스트 파일의 각 서버를 쿼리하여 서버 유형을 얻은 다음 궁극적으로 이 예제에서 그 결과를 센다 내가 처음 시작한 것을 볼 수있다 내 기본 공통 블록으로 여기에 몇 가지 변수를 설정하고 있습니다 데이터 파일을 다운로드 할 URL을 설정하는 중 데이터 파일이 500 개 있습니다 기업은 탭 분리 값입니다

데이터 파일 데이터 경로를 설정하고 있습니다 내가 그것을 구할거야 너는 내가 여기에 몇 가지 목록을 세우고 있음을 볼 수있다 내 서버 응답 및 웹 사이트 수를 설정하고 있습니다 0이 예제 실습에서 다음 모듈을 사용하려고합니다

내 urllib2 또는 pythons url라고 말해야합니다 가치 모듈 파이썬 컬렉션 모듈과 파이썬 sys 모듈 우선 파일을 다운로드 할 때 열려있는 파일을 열어서 그 파일을 열어 두었습니다 로컬로 쓰기로서 나는 읽은 파일을 출력 할 것이다 그리고 항상 당신이 그것을 닫았는지 확인하십시오 이 예제에서는 여기에 내가 멍청하다고 생각한 것을 볼 수있다

방금 다운로드 한 파일로 할 수 있습니다 이제 로컬 파일을 열고 그 파일을 계산할 수있는 읽기 행을 할 것입니다 그 파일에있는 줄 수는 실제로 길이를 줄였습니다 그 데이터 파일의 첫 줄을 알고 있기 때문에 웹 사이트 수는 하나씩 계산됩니다 실제로 헤더 파일입니다

이제 그 로컬 파일을 열 것입니다 다운로드하여 저장하므로 데이터 경로 데이터 파일을 열고 텍스트를 읽습니다 내 입력 파일 파일 핸들 내가 알기 때문에 첫 줄을 건너 뛰고 싶다 헤더 파일 그래서 나는 다음 파일 처리를 할 것이고, 그 다음에 새로운 것을 말할 것이다 목록 우리가 내 웹 사이트의 호출은 그 CSV 모듈 리더 기능과 동일합니다 탭 제거기를 사용하여 입력 파일을 열면 내 웹 사이트가 회사는 회사 이름을 매기고 웹 사이트 URL은 지금이 루프를 진행할 것입니다

조금 길지만 함께 작업 해 봅시다 순위가 매겨진 회사와 웹 사이트가 그 3 가지 변수입니다 내 웹 사이트 목록을 지금 나열하십시오 내 요청은 내 urllib2라고 말할 것입니다 요청 함수와 나는 전체 HTTP 콜론 슬래시를 파싱하고있다

내가 방금 정의한 웹 사이트 변수와 이제는 완료를 제외하고 다른 것을 시도해보십시오 그래서 내가 할 일은 시도를 할 것입니다 urlopen으로 urllib2를 다시 사용합니다 내 요청은 다시 완전히 형성된 HTTP 콜론 슬래시 플러스입니다 url 그래서 내 응답은 모두 5시에서 시간 요청과 함께 열려 있습니다 다시 그 변수가 내 서버 응답에 추가하려고하거나 내가 스크립트의 시작 부분에 내가 설정 한 목록을 말해야합니다

응답 정보 서버 유형에서 서버 변수의 헤더를 가져옵니다 그 urllib2 응답의 나는 또한 그것을 시도 하나를 증가거야 웹 사이트에 오류가 발생하면 내 웹 사이트 개수가 하나씩 늘어납니다 내가 할 일을하는 I / O 오류는 그냥 인쇄하는 것입니다 실제로 실제로 서버 응답에 오류가 추가 될 것입니다 또한 하나씩 증가 시켜서 모든 일이 일어나고있는 동안 나는 또한 닫는다

import sys로 버퍼링하기 나는 화면에서 출력 할 것이다 그리고 그것은 웹 사이트의 총 개수를 계산할 것입니다 웹 사이트 및 당신은 거기 밖으로 볼 수있다 나는 밖으로 표준을 사용하여 그것을 밖으로 플러시 그래서 표준 버퍼링하지 않고 백 스페이스를 인쇄하면 그것은 하나의 라인을 업데이트하고 있습니다 그래서이 루프는 다시 설정하는 것입니다 'get url'요청에 대한 응답 정보 설정 헤더가있는 경우 서버 응답 목록에 추가합니다

오류가 오류를 추가하려고합니다 이 버전에서는 여기에 실제로 조금 추가 된 것을 볼 수 있습니다 논리 그래서 나는 여기에 get 헤더의 응답 정보가 null 값 서버에 슬래시가있는 경우 실제로 빈 칸을 추가하려고합니다 나는 그것을 슬래시로 나눠서 첫 번째 부분 만 가져갈 것입니다 슬래시 (기본적으로 슬래시)는 마치 여러분이 패치 티 슬래시 버전 3 나는 버전 3을 걱정하지 않거나 상관하지 않는다

슬래시 이후의 모든 것에 대해 나는 그저 첫 부분 만 원한다 근본적으로 당신은 내가 단지하려고 생각하고있는 것을 빨갛게 보게됩니다 거기에 어떤 사람들을 논리에 추가하려고 시도하는 논리 모든 것이 모두 끝나고 완료되면 서버 유형 응답 내 collections 모듈 및 collections 모듈에 카운터가 모두 있음을 상기하십시오 그리고 가장 일반적으로이 예에서는 내 카운터가 그 서버 응답의 컬렉션 모듈 도트 카운터가 첫 번째 것입니다

부분은 가장 일반적인 것이고 나머지는 입력 할 수 있습니다 이 모든 것이 같은 줄에 있으므로 서버와 서버에 대한 컬렉션의 빈도 도트 카운터 내 서버 응답 점 가장 밑줄 공통점이 있지만 그 줄이 너무 길어서 내가보기에 그것을 나눠 봤어 서버 및 주파수에 대해 가장 많이 사용되는 두 가지 변수 앞서와 인쇄 나 그리고 난 그냥 주파수를 먼저 결정하기로 결정 몰라요 탭을 클릭 한 다음 서버 이름을 입력하면이 예제가 끝납니다 시각