이 텍스트가 다른 기사의 일부임을 Google에 알리는 방법 (How to tell google this text is part of another article)


문제 설명

이 텍스트가 다른 기사의 일부임을 Google에 알리는 방법 (How to tell google this text is part of another article)

내 웹사이트의 모든 기사 뒤에는 다른 기사에 대한 미리보기가 있습니다. 무작위 미리보기입니다.

문제는 미리보기가 정말 크다는 것입니다. 헤드라인, 부제목 및 6행의 텍스트가 있습니다. 때때로 Google은 내 기사의 일부라고 생각합니다.

이 div에 다른 기사의 텍스트가 포함되어 있음을 Google에 알릴 수 있는 방법이 있습니까?

미리보기 예:


참조 솔루션

방법 1:

By using the appropriate semantic markup that HTML5 offers, user agents (like Google) would, in principle, be able to understand this; but that, of course, doesn’t necessarily mean that they (currently) support (all of) this.

  • The teasers should be outside of the main element. Signal: It’s not part of this page’s main content.

  • The teasers should be in an aside element. Signal: It’s only "tangentially related" to the page’s content.

  • Each teaser should be in its own article element. Signal: It’s a self‑contained item of content.

  • Each teaser’s link (to the full article) should get the bookmark link type. Signal: The permalink URL of the teaser/article is not the same as the current page’s URL.

  • (One could also consider using the blockquote element for the parts taken over literally, i.e., in cases where the teaser doesn’t contain (slightly) different content, like a summary. But it depends on your understanding of your content, if you really quote here.)

However, that doesn’t stop Google to show parts of the teasers in their SERPs (if their algorithms deem it useful, get confused, or whatever). Without using some "hacks" (e.g., with JS or an iframe), it’s not possible nor intended to hide parts of the page for Google Search and their SERPs.

(by Eran Shmuelunor)

참조 문서

  1. How to tell google this text is part of another article (CC BY‑SA 2.5/3.0/4.0)

#web-crawler #html #google-crawlers #SEO






관련 질문

UnicodeError: URL에 ASCII가 아닌 문자가 포함되어 있습니다(Python 2.7). (UnicodeError: URL contains non-ASCII characters (Python 2.7))

크롤링 출력 - 두 변수 연결 (Crawling output - connecting two variables)

Python2.7에서 효과적인 크롤러를 만드는 방법 (How to make an effective crawler in Python2.7)

이 텍스트가 다른 기사의 일부임을 Google에 알리는 방법 (How to tell google this text is part of another article)

크롤링하는 HTML 페이지에서 JavaScript 개체를 구문 분석하는 방법은 무엇입니까? (How to parse a JavaScript object from a HTML page I crawl?)

데이터 크롤링 또는 API 사용 (Crawling data or using API)

파이썬을 사용하여 웹사이트에서 내부 링크만 크롤링 (Crawl only internal links from a website using python)

받은 응답에서 HTML 코드를 긁는 방법은 무엇입니까? (How to scrape the html code from the response received?)

PHP를 사용하여 웹 사이트에서 클래스 이름 스크래핑 (Scraping class name on a website using php)

Scrapy Spider를 사용하는 Craigslist Scraper가 기능을 수행하지 않음 (Craigslist Scraper using Scrapy Spider not performing functions)

BeautifulSoup: 이 링크에서 모든 기사 링크를 가져오는 방법은 무엇입니까? (BeautifulSoup: how to get all article links from this link?)

나는 클라이언트입니다. 선택적으로 http 응답에서 헤더를 제거할 수 있습니까? (I'm client. Can I remove header from http response optionally?)







코멘트