python_projects/selenium/sel_tutorial.py at master · ToffPyDev/python_projects · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

PATH = 'C:/Program Files (x86)/chromedriver.exe'
driver = webdriver.Chrome(PATH)
url = "https://techwithtim.net"
driver.get(url)
search = driver.find_element_by_name('s')
search.clear()
search.send_keys("python", Keys.RETURN)

try:
    main = WebDriverWait(driver, 20).until(
        EC.presence_of_element_located((By.ID, "main"))
    )
    pages = main.find_elements_by_class_name('page-numbers')
    pg = []
    for page in pages:
        pg.append(page.get_attribute('text'))
    last_page = int(pg[-2]) #grab the last page number and convert to int
    j = 1  #create a while loop to go thru all the pages with a searching result python
    while j <= last_page:
        main = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.ID, "main"))
        ) # this main may be redundant, not sure
        articles = main.find_elements_by_tag_name("article")
        for article in articles:
            header = article.find_element_by_css_selector('a')
            title = header.get_attribute('text')
            web = header.get_attribute('href')
            summary = article.find_element_by_class_name('entry-summary')
            print(title)
            print(web)
            print(summary.text)
            print('****************************************')
        element = WebDriverWait(driver, 10).until(
            EC.presence_of_element_located((By.CLASS_NAME, "next"))
                )
        element.click()
        j += 1
except:
    print('something is wrong')
#How do I deal with the random ads page when I scraped the web page by page?