>source

Google 뉴스를 사용하여 검색한 URL 목록을 반환하려고 합니다. GoogleNews 및 pandas 데이터 프레임 모듈을 사용하여 결과를 구성하고 있습니다. 그런 다음 해당 URL을 가져오고 pywebcopy를 사용하여 웹 페이지를 다운로드합니다.

지금은 for 루프가 한 번에 1개가 아닌 9개의 그룹으로 증가합니다. 이것이 save_webpage 기능을 사용하여 웹페이지를 다운로드할 때의 문제라고 생각합니다. save_webpage 함수는 한 번에 하나의 URL만 처리할 수 있다고 생각합니다. 반환되는 결과 범위를 줄이는 방법에 대한 단서가 없습니다.

범위를 조정하려고 시도했지만 (1,1)이 가능한 가장 낮은 것으로 보이며 항상 1 대신 9개의 URL을 반환합니다.

여기 내 code가 있습니다:

googlenews=GoogleNews(start= '12/01/2021',end= '12/31/2021')
googlenews.search('test search')
result=googlenews.result()
df=pd.DataFrame(result)
for i in range(1,1):
    googlenews.getpage(i)
    result=googlenews.result()
    df=pd.DataFrame(result)
list= []
for ind in df.index:
    try:
        dict={}
        article= Article(df['link'][ind])
        article.download()
        article.parse()
        dict['Article Title']= article.title
        dict['Article Text']= article.text
        url= str(df['link'])
        print(str(url))
        download_folder= 'C:\Test_Data'
        kwargs= {'bypass_robots': True, 'project_name': 'PROJECT'}
        save_webpage(url, download_folder, **kwargs)
        list.append(dict)
    except:
        pass

range(start, stop, step) ->range(1, 1)로 무엇을 달성하려고 합니까?

Mr. T2022-01-10 05:27:10

for 루프는 한 번에 1개 대신 9개 그룹으로 증가합니다. 어느 것입니까? 두 개의 for 루프가 있습니다.

Nick ODell2022-01-10 05:27:10

try: ... except: pass로 모든 예외를 삼키지 않으면 어떻게 됩니까?

Jasmijn2022-01-10 05:27:10

@Mr.T -결과 변수의 결과에서 1개의 URL을 가져오려고 합니다. 나는 당신이 말하는 것이 내가 사물을 다르게 생각하게 만드는 것을 봅니다.

jrb08312022-01-10 05:27:10

@NickODell 첫 번째 for 루프에서 발생합니다. where. range(1,1)의 논리에 문제가 있는 것 같습니다. 해명하지 못해 죄송합니다.

jrb08312022-01-10 05:27:10
  • 이전 css : iPad 및 iPhone 배경 이미지 렌더링 문제
  • 다음 regex : 메모장++에서 이 텍스트를 정규식으로 어떻게 바꿀 수 있습니까?