Free Tool

Извлекайте метаданные статей с любой страницы

Automatically pull structured metadata from any article or blog post — title, author, publication date, last modified, tags, word count and estimated reading time.

No account needed for your first scan · Results in seconds

✍️

Автор и даты

Extracts author name, publish date and last modified date from JSON-LD, Open Graph, meta tags and HTML semantic markup.

🏷️

Теги и категории

Finds article tags, categories and keywords declared in structured data or visible on the page.

📊

Количество слов и время чтения

Calculates the word count of the main content and estimates reading time at 200 words per minute.

Как работает экстрактор информации о статьях

1

Enter any article or blog post URL

Paste the link to any blog post, news article or content page you want to analyze.

2

SmartScan extracts metadata from multiple sources

Checks JSON-LD structured data, Open Graph meta tags and semantic HTML elements to find the most accurate article information.

3

Download structured article data as JSON

Get all article metadata — title, author, dates, tags, word count, reading time — in a clean JSON file.

🎯

Извлечение из нескольких источников

Checks JSON-LD (Article, NewsArticle, BlogPosting), Open Graph meta, Twitter Card meta, and HTML semantic elements — whichever has the best data.

🌐

Информация о публикации

Extracts publisher name and logo if available in structured data — useful for source attribution and content audits.

📋

Структурированный JSON-вывод

All article data saved as content/article.json — title, author, dates, tags, word count, reading time, excerpt.

Популярные случаи использования

Content research
Quickly get metadata from articles you're citing, comparing or archiving.
Editorial auditing
Audit your own site's article metadata to spot missing dates, authors or tags.
SEO analysis
Check if competitor articles have proper structured data (NewsArticle, BlogPosting schema).
Data collection
Extract article data at scale for research databases, content aggregators or training datasets.

Часто задаваемые вопросы

Какие поля извлекаются?
Заголовок, имя автора, дата публикации, дата последнего изменения, теги, категории, название издателя, отрывок, количество слов, примерное время чтения и canonical URL.
How does it find the author and date?
SmartScan checks multiple sources in priority order: JSON-LD schema (Article/NewsArticle/BlogPosting), Open Graph meta tags, Twitter Card, and semantic HTML elements like <time> and byline patterns.
Работает ли на всех форматах статей?
Лучше всего работает на стандартных блог-постах, новостных статьях и контентных страницах, использующих структурированные данные. Нестандартные CMS могут давать меньшую точность.
Могу ли я извлекать данные статей с нескольких страниц?
Да — используйте краулинг или пакетный скан для извлечения метаданных статей с нескольких блог-постов или новостных статей.
Этот инструмент бесплатный?
Да — SmartScan бесплатен. Зарегистрируйтесь для 1 000 сканов/мес. Кредитная карта не нужна.

Извлечь метаданные статьи с любой страницы

Free — 1,000 scans/month. No credit card required.

Create Free Account → Try Without Account