likenzhi
2022.02.02
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 11일차 - 나만의 번역 사전 만들기
from selenium import webdriver import time driver = webdriver.Chrome('C:/Users/asus/Desktop/documents/대외활동/모각코/모각코1월과정-파이썬 크롤링 과정/chromedriver_win32/chromedriver.exe') URL = "https://papago.naver.com/" driver.get(URL) time.sleep(3) Dic = {} List = [] while True:     word = input("번역할 영단어 입력 (0을 입력하면 종료) : ")     if word == "0":         break     List.append(word) for word in List:     form = driver.find_element_by_css_selector("textarea#txtSource")     form.send_keys(word)     button = driver.find_element_by_css_selector("button#btnTranslate")     button.click()     time.sleep(2)     result = driver.find_element_by_css_selector("div#txtTarget")     Dic[word] = result.text     form.clear() print(Dic) ㅠㅠ어렵네요,,
guswlcarrie
2022.01.28
likenzhi
2022.01.28
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 15일차 -자유로운 크롤링
from selenium import webdriver import time driver = webdriver.Chrome('C:/Users/YUN JAEHWAN/Desktop/부트캠프/chromedriver') login_url = 'https://nid.naver.com/nidlogin.login' driver.get(login_url) time.sleep(2) my_id = 'ID' my_pw = 'PW' driver.execute_script("document.getElementsByName('id')[0].value = \'" + my_id + "\'") driver.execute_script("document.getElementsByName('pw')[0].value = \'" + my_pw + "\'") time.sleep(1) button = driver.find_element_by_id('log.login') button.click() time.sleep(1) comu_url = 'https://cafe.naver.com/codeuniv' driver.get(comu_url) time.sleep(1) menu = driver.find_element_by_id('menuLink90') menu.click() time.sleep(1) for i in range(1, 16):     XPath = "/html/body/div[1]/div/div[4]/table/tbody/tr[" + str(i) + "]/td[1]/div[2]/div/a"     driver.switch_to.frame('cafe_main')     time.sleep(1)     writing = driver.find_element_by_xpath(XPath)     writing.click()     time.sleep(1)     content = driver.find_element_by_css_selector('div.se-component-content').text     print(content)       driver.back()     time.sleep(1) driver.close() 어제에 이어 학습내용을 따라 해봤습니다.. 어제부터 오류가 뜨는데 왜 그런지도 모르겠네요.. 크롤링 과정을 다시 공부해야 할 것 같아요,,!
likenzhi
2022.01.28
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 14일차 - 자유로운 크롤링
아직 응용이 어려워서,, 오늘자 학습내용 코드를 복습했습니다.. from selenium import webdriver import time driver = webdriver.Chrome('C:/Users/asus/Desktop/documents/대외활동/모각코/모각코1월과정-파이썬 크롤링 과정/chromedriver_win32/chromedriver.exe') login_url = 'https://nid.naver.com/nidlogin.login' driver.get(login_url) time.sleep(3) my_id = 'victoria902' my_pw = 'dmswl4365' driver.execute_script("document.getElementsByName('id')[0].value = \'" + my_id + "\'") driver.execute_script("document.getElementsByName('pw')[0].value = \'" + my_pw + "\'") time.sleep(1) button = driver.find_element_by_id('log.login') button.click() time.sleep(1) comu_url = 'https://cafe.naver.com/codeuniv' driver.get(comu_url) time.sleep(1) menu = driver.find_element_by_id('menuLink90') menu.click() time.sleep(1) driver.switch_to.frame('cafe_main') time.sleep(1) writing = driver.find_element_by_xpath('/html/body/div[1]/div/div[4]/table/tbody/tr[1]/td[1]/div[3]/div/a') writing.click() time.sleep(1) content = driver.find_element_by_css_selector('div.se-component-content').text print(content) driver.close()
likenzhi
2022.01.27
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 13일차 - 한영사전 만들기
from selenium import webdriver import time import csv driver = webdriver.Chrome('C:/Users/asus/Desktop/documents/대외활동/모각코/모각코1월과정-파이썬 크롤링 과정/chromedriver_win32/chromedriver.exe') papago_url = 'https://papago.naver.com/' driver.get(papago_url) time.sleep(3) driver.find_element_by_css_selector('button.btn_switch___x4Tcl').click() time.sleep(3) kor = [] f = open('C:/Users/asus/Desktop/documents/대외활동/모각코/모각코1월과정-파이썬 크롤링 과정/my_papago.csv', 'r') rdr = csv.reader(f) next(rdr) for row in rdr:     kor.append(row[1]) for question in kor:     word = question     form = driver.find_element_by_css_selector("textarea#txtSource")     form.send_keys(word)     button = driver.find_element_by_css_selector("button#btnTranslate")     button.click()     time.sleep(2)     result = driver.find_element_by_css_selector("div#txtTarget")     print(word, ':', result.text)     form.clear() driver.close() f.close() 결과 모듈 탐색 오류 때문에 애먹었습니다.. 많이 힘드네요,.
likenzhi
2022.01.25
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 9일차 - G마켓 크롤링
import requests import bs4 list=[8,1,2,13,3] list2=["<판매인기순>","<낮은가격순>","<높은가격순>","<상품평많은순>","<신규상품순>"] URL = "https://browse.gmarket.co.kr/search?keyword=마스크%s=" print("<G마켓의 마스크 상품 정보>") for i in range(5):     raw = requests.get(URL+str(list[i]))     html = bs4.BeautifulSoup(raw.text, 'html.parser')     box = html.find('div', {'class' : 'section__module-wrap', 'module-design-id' : '15'})     items = box.find_all('div', {"class" : 'box__item-container'})     print(list2[i])     for item in items[:5]:         title = item.find('span', {'class' : 'text__item'})         price = item.find('strong', {'class' : 'text__value'})         print("이름 : ", title.text)         print('가격 : ', price.text) 결과 <G마켓의 마스크 상품 정보> <판매인기순> 이름 :   (S-8cm핑크) 마스크밴드 마스크이어가이드 귀보호밴드  가격 :  7,530 이름 :   (S-8cm블루) 마스크밴드 마스크이어가이드 귀보호밴드 가격 :  7,530 이름 :   (S-8cm검정) 마스크밴드 마스크이어가이드 귀보호밴드 가격 :  7,530 이름 :   (S-8cm핑크) 마스크밴드 마스크이어가이드 귀보호밴드 가격 :  5,290 이름 :   (S-8cm블루) 마스크밴드 마스크이어가이드 귀보호밴드 가격 :  5,290 <낮은가격순> 이름 :   1대1 사은품 나루마스크 X1 N1s X5 F5s 여름 쿨마스크 가격 :  19,000 이름 :   NAROO 나루 F5S X1 X5 X5H 먼지 필터링 마스크 가격 :  23,000 이름 :   나루마스크 X5 X1 N1s F5 방한마스크  자외선마스크 가격 :  28,000 이름 :    aer 아에르 어드밴스드 KF94 마스크 블랙30매(S/M/L 택1) 가격 :  35,700 이름 :   도부라이프텍-방독마스크 DM-24S 단구 (1EA) 면 용 방 가격 :  44,960 <높은가격순> 이름 :   실크마스크 S블랙 2P /소형/3D입체/어린이마스크      가격 :  8,500 이름 :   2-4세추천 아이코코 KF94 소형S 화이트 마스크 50매   가격 :  27,500 이름 :   2-4세추천 아이코코 KF94 소형S 블랙 마스크 50매     가격 :  27,500 이름 :   2-4세추천 아이코코 KF94 소형S 화이트 마스크 100매  가격 :  55,000 이름 :   2-4세 아이코코 소형S 핑크 컬러 마스크 25매         가격 :  14,750 <상품평많은순> 이름 :   (핫트랙스) Beistle 20s 마스크 4 팩 9 75 13 5 멀티 컬러  가격 :  41,730 이름 :   윈블리 국산 항균 패션 마스크(블랙-S)(8-13세아동용)      가격 :  4,900 이름 :   윈블리 국산 패션마스크(화이트체크-S)(8-13세아동용)      가격 :  4,900 이름 :   13일의 금요일 전기톱 살인마 제이슨 마스크 가면 - S 가격 :  16,500 이름 :   Beistle 20s 마스크 4 팩 9 75 13 5 멀티 컬러 가격 :  43,580 <신규상품순> 이름 :   정품 마스크가드 숨쉬기 편한 마스크뽕 S사이즈 3개입 가격 :  6,900 이름 :   다용도 걸이 3개입 일자형 마스크 열쇠 차키 수건 s 가격 :  1,310 이름 :   다용도 걸이 3개입 마스크 열쇠 차키 국자 수건 s 가격 :  1,310 이름 :   나루마스크 F5 F5s F3H 세탁가능 필터링마스크 가격 :  25,300 이름 :   (S 5개) 컴패니언 미세먼지 방지 애견 마스크 3p X 가 가격 :  14,470 PS C:\Users\asus\Desktop\documents\대외활동> 살려주세요,,,
likenzhi
2022.01.20
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 8일차 - BeautifulSoup 활용하기
⭐ 1번 문제 예를 들어 '전신거울'을 검색했을 때, 키워드 검색 : https://browse.gmarket.co.kr/search?keyword=전신거울 판매 인기순 : https://browse.gmarket.co.kr/search?keyword=전신거울&s=8 낮은 가격순 : https://browse.gmarket.co.kr/search?keyword=전신거울&s=1 높은 가격순 : https://browse.gmarket.co.kr/search?keyword=전신거울&s=2 상품평 많은순 : https://browse.gmarket.co.kr/search?keyword=전신거울&s=13 신규 상품순 : https://browse.gmarket.co.kr/search?keyword=전신거울&s=3 ⭐ 2번 문제 전체 별 : <span class=image_bg-star> 평점을 나타내는 별 : <span class=image_awards-points>
likenzhi
2022.01.18
@likenzhi님이 새 포스트를 작성했습니다.
[모각코 플러스] 파이썬 심화 : 웹 크롤링 6일차 - HTML 코드 가져오기
작성한 파이썬 코드 import requests URL = 'http://www.cgv.co.kr/movies/?lt=1&ft=0' raw = requests.get(URL, verify=False) # print(raw) print(raw.text) 가져온 HTML코드 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">  <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ko" lang="ko"> <head>          <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />     <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" />     <meta http-equiv="Expires" content="-1" />     <meta http-equiv="Pragma" content="no-cache" />     <meta http-equiv="Cache-Control" content="No-Cache" />     <meta http-equiv="imagetoolbar" content="no" />     <meta name="viewport" content="width=1024" />     <meta name="keywords" content="CGV, 시지브이, 영화관, 극장, 영화, 티켓, 박스오피스, 극장, Movie, Theater, Cinema, Cgv, cgv, 예매, 상영작" />     <meta name="description" content="CGV는 선진화된 관람문화와 최고의 서비스로 고객에게 잊을 수 없는 감동을 선사합니다. CGV홈페이지를 통해 영화 예매뿐만 아니라 그 이상의 서비스와 감동을 전달하고, 다양한 즐거움과 특별한 경험을 제공하고자 합니다 ." />     <meta property="og:site_name" content="영화 그 이상의 감동. CGV"/>     <meta id="ctl00_og_title" property="og:title" content="영화 그 이상의 감동. CGV"></meta>     <meta id="ctl00_og_image" property="og:image" content="https://img.cgv.co.kr/WebApp/images/common/logo_new_kakao_prevw.png"></meta>     <link rel="alternate" href="http://m.cgv.co.kr" />     <link rel="shortcut icon" href="https://img.cgv.co.kr/theater_img/favicon.ico" type="image/x-icon" />     <title id="ctl00_headerTitle"></title>     <link rel="shortcut icon" type="image/x-icon" href="https://img.cgv.co.kr/R2014/images/favicon.ico" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/webfont.css" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/reset.css" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/layout.css" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/module.css?20211209" />           <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/content.css" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/common.css" />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/eggupdate.css" />     <link rel="stylesheet" media="print" type="text/css" href="https://img.cgv.co.kr/R2014/css/print.css" />     <link rel="stylesheet" type="text/css" href="https://img.cgv.co.kr/R2014/js/jquery.ui/smoothness/jquery-ui-1.10.4.custom.min.css" />     <script type="text/javascript" src="/common/js/extraTheaters.js"></script>     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/app.config.js"></script>     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery-1.10.2.min.js"></script>     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.plugin/jquery.tmpl.min.js"></script>             <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.plugin/jquery.validate.js"></script>             <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.plugin/jquery.paging.min.js"></script>           <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.ui/jquery-ui-1.10.4.custom.min.js"></script>    <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.utils.js"></script>     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/app.utils.js"></script>         <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.utils.pageing.js"></script>     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/app.init.js"></script>     <!--[if lte IE 9]><script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.plugin/jquery.placeholder.js"></script><![endif]-->     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/jquery.plugin/jquery.dotdotdot.min.js"></script>        <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/silverlight_link.js"></script>         <script src="https://img.cgv.co.kr/R2014/js/slick/slick.js" type="text/javascript" charset="utf-8"></script>           <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/phototicket/phototicket.css"  />     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/slick.css" />         <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/slick-theme-custom.css" />     <script type="text/javascript" src="https://img.cgv.co.kr/R2014/js/icheck/login.timer.js"></script>     <script src="https://img.cgv.co.kr/R2014/js/icheck/icheck.min.js" type="text/javascript" charset="utf-8"></script>         <link rel="stylesheet" type="text/css" href="https://img.cgv.co.kr/R2014/js/icheck/iCheck.css" />     <!-- 2020.05.07 감정지수/프리에그 프로젝트 추가 -->     <link rel="stylesheet" media="all" type="text/css" href="https://img.cgv.co.kr/R2014/css/preegg.css" />     <!-- 각페이지 Header Start-->     <!--/각페이지 Header End-->     <script type="text/javascript">         //<![CDATA[         _TRK_CP = "/홈";         app.config('staticDomain', 'https://img.cgv.co.kr/R2014/')             .config('imageDomain', 'https://img.cgv.co.kr')             .config('isLogin', 'False');         // AD FLOAT         // 암호화 할 문자열과 키값(상수값)을 매개변수로 받는다.         function EncryptAD(str, key) {             output = new String;             Temp = new Array();             TextSize = str.length;             for (i = 0; i < TextSize; i++) {                 // key 값을 원하는 대로 연산을 한다                 output += String.fromCharCode(str.charCodeAt(i) + parseInt(key) + 123 + i);             }             return output;         }         // 복호화         // 암호화 된 문자열과 키값(상수값)을 매개변수로 받는다.         function DecryptAD(str, key) {             output = new String;             Temp = new Array();             TextSize = str.length;             for (i = 0; i < TextSize; i++) {                 // 암호화시 사용한 연산과 같아야 한다.                 output += String.fromCharCode(str.charCodeAt(i) - (parseInt(key) + 123 + i));             }             return output;         }         function getCookieVal(offset) {             var endstr = document.cookie.indexOf(";", offset);             if (endstr == -1) endstr = document.cookie.length;             return unescape(document.cookie.substring(offset, endstr));         }         function GetCookieAd(name) {             var arg = name + "=";             var alen = arg.length;             var clen = document.cookie.length;             var i = 0;             while (i < clen) { //while open                 var j = i + alen;                 if (document.cookie.substring(i, j) == arg)                     return getCookieVal(j);                 i = document.cookie.indexOf(" ", i) + 1;                 if (i == 0) break;             } //while close             return null;         }         function setCookieAD(name, value, expiredays) {             var todayDate = new Date();             todayDate.setTime(todayDate.getTime() + (expiredays * 24 * 60 * 60 * 1000));             document.cookie = name + "=" + escape(value) + "; expires=" + todayDate.toGMTString() + "; path=/; domain=cgv.co.kr";         }         function CloseAD() {             var AdUrl = window.location.href;             var ArrAdUrl = AdUrl.split("/");             var CurCookieName = 'CgvPopAd-' + ArrAdUrl[3];             var CurCookieUrl = GetCookieAd(CurCookieName);             var CookieUrl = ArrAdUrl[3];             CookieUrl = EncryptAD(CookieUrl, "15442280");             setCookieAD(CurCookieName, CookieUrl, '1');             $(document).find('#ad_float1').hide();         }         function OpenAD() {             var AdUrl = window.location.href;             var ArrAdUrl = AdUrl.split("/");             var CookieUrl = ArrAdUrl[3];             var CurCookieName = 'CgvPopAd-' + ArrAdUrl[3];             var CurCookieUrl = GetCookieAd(CurCookieName);             if (CurCookieUrl == null) {                 CurCookieUrl = "";             }             else {                 CurCookieUrl = DecryptAD(CurCookieUrl, "15442280");             }             if (CurCookieUrl.indexOf(CookieUrl) != -1) {                 $(document).find('#ad_float1').hide();             }             //section.cgv.co.kr 매거진 체크             var magazineckurl = GetCookieAd("CgvPopAd-magazine");             if (magazineckurl != null) {                 var magazineck = DecryptAD(magazineckurl, "15442280");                 if (magazineck != null && magazineck == "magazine") {                     //값이있는경우 표시하지않음                     $(document).find('#ad_float1').hide();                 }             }         }         //]]>     </script> </head> <body class=""> <div class="skipnaiv">         <a href="#contents" id="skipHeader">메인 컨텐츠 바로가기</a> </div> <div id="cgvwrap">     <div class="cgv-ad-wrap" id="cgv_main_ad">         <div id="TopBarWrapper" class="sect-head-ad">             <div class="top_extend_ad_wrap">                 <div class="adreduce" id="adReduce">                     <iframe src="//ad.cgv.co.kr/NetInsight/html/CGV/CGV_201401/sub@TopBar_EX" width="100%" height="80" title="" frameborder="0" scrolling="no" topmargin="0" leftmargin="0" marginwidth="0" marginheight="0" name="TopBanner" id="TopBanner"></iframe>                 </div>                 <div class="adextend" id="adExtend"></div>             </div><!-- //.top_extend_ad_wrap -->         </div>     </div>       <!-- S Header         Description         - class 'nav' 에 class 'active' 추가시 서브메뉴노출         - class 'nav' 에 class 'fixed' 추가시 상단고정되며 스타일 변경됨      -->         <div class="header">             <!-- 서비스 메뉴 --> <div class="header_content">     <div class="contents">         <h1><a href="/"><img src="https://img.cgv.co.kr/R2014/images/common/logo/logoRed.png" alt="CGV" /></a><span>CULTUREPLEX</span></h1>         <ul class="memberInfo_wrap">             <!-- Advertisement -->                         <div class="ad-partner">                 <a href="http://www.cgv.co.kr/culture-event/event/detailViewUnited.aspx?seq=31426&menu=006"  >                     <img src="https://img.cgv.co.kr/WingBanner/2022/0110/16417749747880.png" alt="현대M포인트" />                 </a>                         </div>             <!-- /Advertisement -->             <li><a href="/user/login/?returnURL=http%3a%2f%2fwww.cgv.co.kr%2fmovies%2fdefault.aspx%3flt%3d1%26ft%3d0"><img src="https://img.cgv.co.kr/R2014/images/common/ico/loginPassword.png" alt="로그인" /><span>로그인</span></a></li>                     <li><a href="/user/join/"><img src="https://img.cgv.co.kr/R2014/images/common/ico/loginJoin.png" alt="회원가입 " /><span>회원가입</span></a></li>             <li><a href="/user/mycgv/"><img src="https://img.cgv.co.kr/R2014/images/common/ico/loginMember.png" alt="MY CGV" /><span>MY CGV</span></a></li>             <li><a href="/support/default.aspx"><img src="https://img.cgv.co.kr/R2014/images/common/ico/loginCustomer.png" alt="고객�
jini_archive
2022.01.13
@jini_archive님이
[모각코 플러스] 파이썬 심화 : 웹 크롤링 4일차 - HTML 태그 찾기
포스트에 댓글을 남겼습니다.
jini_archive
2022.01.13