Artikel-Metadaten von jeder Seite extrahieren
Automatically pull structured metadata from any article or blog post — title, author, publication date, last modified, tags, word count and estimated reading time.
No account needed for your first scan · Results in seconds
Autor & Datum
Extracts author name, publish date and last modified date from JSON-LD, Open Graph, meta tags and HTML semantic markup.
Tags & Kategorien
Finds article tags, categories and keywords declared in structured data or visible on the page.
Wortanzahl & Lesezeit
Calculates the word count of the main content and estimates reading time at 200 words per minute.
So funktioniert der Artikel-Extraktor
Enter any article or blog post URL
Paste the link to any blog post, news article or content page you want to analyze.
SmartScan extracts metadata from multiple sources
Checks JSON-LD structured data, Open Graph meta tags and semantic HTML elements to find the most accurate article information.
Download structured article data as JSON
Get all article metadata — title, author, dates, tags, word count, reading time — in a clean JSON file.
Multi-Source-Extraktion
Checks JSON-LD (Article, NewsArticle, BlogPosting), Open Graph meta, Twitter Card meta, and HTML semantic elements — whichever has the best data.
Publikationsinfo
Extracts publisher name and logo if available in structured data — useful for source attribution and content audits.
Strukturierte JSON-Ausgabe
All article data saved as content/article.json — title, author, dates, tags, word count, reading time, excerpt.
Beliebte Anwendungsfälle
Quickly get metadata from articles you're citing, comparing or archiving.
Audit your own site's article metadata to spot missing dates, authors or tags.
Check if competitor articles have proper structured data (NewsArticle, BlogPosting schema).
Extract article data at scale for research databases, content aggregators or training datasets.
Häufig gestellte Fragen
- Welche Felder werden extrahiert?
- Titel, Autorenname, Veröffentlichungsdatum, Änderungsdatum, Tags, Kategorien, Herausgeber, Auszug, Wortanzahl, geschätzte Lesezeit und Canonical-URL.
- How does it find the author and date?
- SmartScan checks multiple sources in priority order: JSON-LD schema (Article/NewsArticle/BlogPosting), Open Graph meta tags, Twitter Card, and semantic HTML elements like
<time>and byline patterns. - Funktioniert es bei allen Artikelformaten?
- Es funktioniert am besten bei Standard-Blogposts, Nachrichtenartikeln und Inhaltsseiten mit strukturierten Daten. Benutzerdefinierte CMS-Implementierungen können geringere Genauigkeit aufweisen.
- Kann ich Artikeldaten von mehreren Seiten extrahieren?
- Ja — verwenden Sie Site-Crawl oder Bulk-Scan, um Artikel-Metadaten von mehreren Blogposts oder Nachrichtenartikeln zu extrahieren.
- Ist dieses Tool kostenlos?
- Ja — SmartScan ist kostenlos. Registrieren Sie sich für 1.000 Scans/Monat. Keine Kreditkarte erforderlich.
Artikel-Metadaten von jeder Webseite extrahieren
Free — 1,000 scans/month. No credit card required.