Wikidata:Akses data

From Wikidata
Jump to navigation Jump to search
This page is atranslated versionof the pageWikidata:Data accessand the translation is 93% complete.

Wikidata saat ini berisi lebih dari 100 juta Item dan lebih dari 650.000 Leksem, dan jumlah ini akan terus bertambah. Ada banyak metode yang tersedia untuk mengakses semua data itu -- dokumen ini menjabarkannya dan membantu calon pengguna memilih metode terbaik yang sesuai dengan kebutuhan mereka.

Sangatlah penting untuk memilih metode akses yang memberimu data yang Anda perlukan dengan cara tercepat, paling efisien sambil tidak memuat beban yang tidak perlu di Wikidata; halaman ini adalah untuk membantumu melakukan hal itu.

Sebelum kita mulai

Menggunakan data di Wikidata

Logo kami

Wikidata menawarkan berbagai macam data umum tentang segala sesuatu di bawah matahari. Semua data itu dilisensikanCC0,"No rights reserved", untuk domain publik.

Perubahan pada API dan metode lain untuk mengakses Wikidata tunduk padaKebijakan Antarmuka Stabil.Sumber data pada halaman initidak dijaminmenjadi antarmuka yang stabil.

Proyek-Proyek Wikimedia

Dokumen ini tentang mengakses data dari luar proyek Wikimedia. Jika Anda perlu menampilkan data dari Wikidata dalam proyek Wikimedia lainnya, di mana Anda dapat menggunakan fungsi parser, Lua dan/atau metode khusus internal lainnya, lihatCara menggunakan data di proyek Wikimedia.

Pengalaman terbaik data

Sukarelawan seperti orang-orang ini – dan Anda – adalah yang membangun Wikidata

Kami menawarkan data di Wikidata secara bebas dan tanpa persyaratan atribusi di bawahCC-0.Sebagai imbalannya, kami akan sangat menghargai jika, dalam proyek Anda, Anda menyebut Wikidata sebagai asal data Anda. Dengan melakukan itu, Anda membantu memastikan bahwa Wikidata akan bertahan lama untuk menyediakan data terkini dan berkualitas tinggi. Kami juga mempromosikan proyek terbaik yang menggunakan data Wikidata.

Beberapa contoh untuk mengatribusikan Wikidata: "Powered by Wikidata" ( "Didukung oleh Wikidata" ), "Powered by Wikidata data" ( "Didukung oleh data Wikidata" ), "Powered by the magic of Wikidata" ( "Didukung oleh keajaiban Wikidata" ), "Using Wikidata data" ( "Menggunakan data Wikidata" ), "With data from Wikidata" ( "Dengan data dari Wikidata" ), "Data from Wikidata" ( "Data dari Wikidata" ), "Source: Wikidata" ( "Sumber: Wikidata" ), "Including data from Wikidata" ( "Termasuk data dari Wikidata" ) dan sebagainya. Anda juga dapat menggunakan salah satu darifile siap pakai.

Anda boleh menggunakan logo Wikidata yang ditunjukkan di atas, tetapi dengan melakukan itu Anda tidak boleh menyiratkan dukungan oleh Wikidata atau oleh Yayasan Wikimedia dengan cara apa pun.

Harap tawarkan kepada pengguna Anda cara untuk melaporkan masalah dalam data, dan temukan cara untuk memberi masukan ini kembali ke komunitas editor Wikidata, misalnya melaluiPencari Ketidakcocokan.Harap bagikan lokasi tempat Anda mengumpulkan masalah ini diObrolan proyek.

Pengalaman terbaik mengakses

Ketika mengakses data Wikidata, amati pengalaman terbaik berikut:

  • Ikuti kebijakan Agen-Pengguna -- kirimkan tajuk Agen-Pengguna yang baik.
  • Ikuti kebijakan robot: kirimAccept-Encoding: gzip,deflatedan jangan membuat terlalu banyak permintaan sekaligus.
  • Jika Anda mendapatkan respon 429 Too Many Requests (429 Terlalu Banyak Permintaan), hentikan pengiriman permintaan lebih lanjut untuk sementara waktu (lihat tajuk responRetry-After)
  • Bila tersedia (seperti dengan Layanan Kueri Wikidata), tetapkan batas waktu terendah yang masuk akal untuk data Anda.
  • Saat menggunakan MediaWiki Action API, manfaatkan secara bebas parametermaxlagdan lihat panduan lainnya yang tercantum dalamAPI:Etiket.

Pencarian

Apa itu?

Wikidata menawarkan indeksElasticsearchuntuk pencarian tradisional melalui datanya:Special:Search

Kapan menggunakannya?

Gunakan pencarian saat Anda perlu mencari string teks, atau saat Anda mengetahui nama entitas yang Anda cari tetapi bukan entitas persisnya. Ini juga cocok untuk kasus di mana Anda dapat menentukan pencarian berdasarkan beberapa relasi yang sangat sederhana dalam data.

Jangan gunakan penelusuran saat relasi dalam data Anda lebih baik digambarkan sebagai kompleks.

Rincian

Anda dapat membuat pencarian Anda lebih kuat dengan kata kunci tambahan khusus untuk Wikidata:haswbstatement,inlabel,wbstatementquantity,hasdescription,haslabel.Fungsi pencarian ini didokumentasikandi halaman ekstensi CirrusSearch.Ia juga memilikitindakan APIsendiri.

Antarmuka Data Tertaut (URI)

Apa itu?

Antarmuka Data Tertaut menyediakan akses ke entitas individu melalui URI:http://www.wikidata.org/entity/Q???

Kapan menggunakannya?

Gunakan Antarmuka Data Tertaut saat Anda perlu mendapatkan entitas individual lengkap yang sudah Anda ketahui.

Jangan menggunakannya saat Anda tidak jelas tentang entitas mana yang Anda perlukan -- coba telusuri atau ajukan kueri terlebih dahulu. Itu juga tidak cocok untuk meminta data dalam jumlah besar.

Rincian

ButirQ42

Setiap Item atau Properti memilikiURIpersisten yang dibuat dari ruang nama konsep Wikidata dan ID Item atau Properti (mis.,Q42,P31) serta data konkret yang dapat diakses oleh Item atau Properti itu atau data PropertiURL.

Ruang nama untuk data Wikidata tentang entitas adalahhttps://wikidata.org/wiki/Special:EntityData.

Menambahkan ID entitas ke awalan ini (singkatnya Anda dapat menggunakan/entity/) membuat bentuk abstrak (format-netral) dari URL data entitas. Saat mengakses sumber daya di ruang nama Special:EntityData, halaman khusus menerapkannegosiasi kontenuntuk menentukan format keluaran. Jika Anda membuka sumber daya di browser, Anda akan melihat halaman HTML yang berisi data tentang entitas, karena browser web lebih menyukai HTML. Namun, klien data tertaut akan menerima data entitas dalam format seperti JSON atau RDF -- apa pun yang ditentukan klien dalam header HTTPAccept:miliknya.

Sebagai contoh, ambilkonsep URIini untuk Douglas Adams -- yang mengacu pada orang di dunia nyata, bukan pada deskripsi konkret Wikidata:
http://www.wikidata.org/entity/Q42
Sebagai manusia dengan mata dan peramban, Anda mungkin ingin mengakses datatentangDouglas Adams dengan menggunakan konsep URI sebagaiURL.Melakukan hal itu akan memicu pengalihan HTTP dan meneruskan klien ke URL data yang berisi data WikidatatentangDouglas Adams:https://www.wikidata.org/wiki/Special:EntityData/Q42.

Saat Anda perlu melewati negosiasi konten, misalnya, untuk melihat konten non-HTML di browser web, Anda bisa menentukan format data entitas dengan menambahkan ekstensi yang sesuai ke URL data; contohnya termasuk.json,.rdf,.ttl,.ntatau.jsonld.Misalnya,https://www.wikidata.org/wiki/Special:EntityData/Q42.jsonmemberi Anda Item Q42 dalam format JSON.

Output RDF yang kurang bertele-tele

Secara default, data RDF yang dikembalikan oleh antarmuka Data Tertaut dimaksudkan untuk menjadi lengkap dengan sendirinya, sehingga menyertakan deskripsi entitas lain yang dirujuknya. Jika Anda ingin mengecualikan informasi tersebut, Anda dapat menambahkan parameter kueri?flavor=dumpke URL yang Anda minta.

Dengan menambahkan&flavorke URL, Anda dapat mengontrol dengan tepat jenis data yang dikembalikan.

  • ?flavor=dump:Tidak termasuk deskripsi entitas yang dirujuk dalam data.
  • ?flavor=simple:Hanya memberikan pernyataan yang benar (pernyataan dengan peringkat terbaik tanpapenentuataureferensi), beserta tautan situs dan informasi versi.
  • ?flavor=full(default): Argumen "penuh" mengembalikan semua data. (Anda tidak perlu menentukan ini karena ini adalah defaultnya.)

Jika Anda ingin wawasan yang lebih dalam tentang apa yang diperlukan setiap opsi, Anda dapat mengintip ke dalamkode sumber.

Revisi dan menyembunyikan

Anda dapat meminta revisi tertentu dari suatu entitas denganrevisionparameter kueri:https://www.wikidata.org/wiki/Special:EntityData/Q42.json?revision=112.

Format URL berikut masing-masing digunakan oleh antarmuka pengguna dan oleh pembaru layanan kueri, jadi jika Anda menggunakan salah satu format URL yang sama, kemungkinan besar Anda akan mendapatkan respons (cache) yang lebih cepat:

Layanan Kueri Wikidata

Apa itu?

Wikidata Query Service (WDQS) adalah titik akhir SPARQL milik Wikidata. Ia mengembalikan hasil kueri yang dibuat dalam bahasa kueri SPARQL:https://query.wikidata.org

Kapan menggunakannya?

Gunakan WDQS saat Anda hanya mengetahui karakteristik data yang diinginkan.

Jangan gunakan WDQS untuk melakukan pencarian teks atau fuzzy -- FILTER(REGEX(...)) adalah antipola. (Gunakanpenelusurandalam kasus tersebut.)

WDQS juga tidak cocok bila data yang Anda inginkan kemungkinan besar, persentase yang besar dari semua data Wikidata. (Pertimbangkan untuk menggunakantimbunandalam kasus seperti itu.)

Rincian

Anda dapat mengkueri data di Wikidata melalui titik akhir SPARQL kami,Layanan Kueri Wikidata.Layanan ini dapat digunakan sebagai antarmuka web interaktif, atau secara terprogram dengan mengirimkan permintaanGETatauPOSTkehttps://query.wikidata.org/sparql.

Layanan kueri paling baik digunakan saat rangkaian hasil yang Anda inginkan dicakup secara sempit, yaitu, saat Anda memiliki kueri, Anda cukup yakin sudah menentukan kumpulan data yang dihasilkan secara akurat. Jika ide Anda tentang kumpulan hasil kurang terdefinisi dengan baik, maka jenis pekerjaan yang akan Anda lakukan terhadap layanan kueri akan lebih menyerupai pencarian; sering kali Anda pertama-tama harus melakukan pekerjaan terkait penelusuran semacam ini untuk mempertajam kueri Anda. Lihat bagianPencarian.

Titik akhir Fragmen Data Tertaut (Linked Data Fragments endpoint)

Apa itu?

Titik akhir Fragmen Data Tertaut (Linked Data Fragments endpoint (LDF)) adalah metode yang lebih eksperimental untuk mengakses data Wikidata dengan menentukan pola dalam tiga kali lipat:https://query.wikidata.org/bigdata/ldf.Komputasi terjadi terutama di sisi klien.

Kapan menggunakannya?

Gunakan titik akhir LDF saat Anda dapat menentukan data yang Anda cari menggunakan pola rangkap tiga, dan saat kumpulan hasil Anda cenderung cukup besar. Titik akhir bagus untuk digunakan saat Anda memiliki daya komputasi yang signifikan.

Karena ini eksperimental, jangan gunakan titik akhir LDF jika Anda memerlukan titik akhir yang benar-benar stabil atau rangkaian hasil yang lengkap. Dan seperti yang disebutkan sebelumnya, gunakan hanya jika Anda memiliki daya komputasi yang memadai, karena titik akhir LDF memindahkan komputasi ke sisi klien.

Rincian

Jika Anda memiliki sebagian informasi tentang apa yang Anda cari, seperti ketika Anda memiliki dua dari tiga komponen triple(s), Anda dapat menemukan apa yang Anda cari dengan menggunakan antarmukaLinked Data Fragmentsdihttps://query.wikidata.org/bigdata/ldf.Lihatpanduan penggunadanhalaman komunitasuntuk informasi lebih lanjut.

Wikibase REST API

What is it?

The Wikibase REST API is an OpenAPI-based interface that allows users to interact with, retrieve and edit items and statements on Wikibase instances – including of course Wikidata:Wikidata REST API

When to use it?

The Wikibase REST API is still under development, but for Wikidata it's intended to functionally replace theAction APIas it's a dedicated interface made just for Wikibase/Wikidata.

The use cases for the Action API apply to the Wikibase REST API as well. Use it when your work involves:

  • Editing Wikidata
  • Getting direct data about entities themselves

Don't use the Wikibase REST API when your result set is likely to be large. (Consider using adumpin such cases.)

It's better not to use the Wikibase REST API when you'll need to further narrow the result of your API request. In such cases it's better to frame your work as asearch(for Elasticsearch) or aquery(for WDQS).

Details

The Wikibase REST API hasOpenAPI documentationusingSwagger.You can also review thedeveloper documentation.https://doc.wikimedia.org/Wikibase/master/php/repo_rest-api_README.htmlhttps://doc.wikimedia.org/Wikibase/master/php/repo_rest-api_README.html

API Tindakan MediaWiki

Apa itu?

Wikidata API adalah Action API milik MediaWiki, diperluas untuk menyertakan beberapa tindakan khusus Wikibase:https://wikidata.org/w/api.php

Kapan menggunakannya?

Gunakan API saat pekerjaan Anda melibatkan:

  • Mengedit Wikidata
  • Mendapatkan data tentang entitas itu sendiri seperti riwayat revisinya
  • Mendapatkan semua data entitas dalam format JSON, dalam kelompok kecil entitas (hingga 50 entitas per permintaan).

Jangan gunakan API saat kumpulan hasil Anda cenderung besar. (Pertimbangkan untuk menggunakantumpukandalam kasus seperti itu.)

API juga kurang cocok untuk situasi di mana Anda ingin meminta status entitas saat ini di JSON. (Untuk kasus seperti itu, pertimbangkan untuk menggunakanLinked Data Interface,yang kemungkinan akan memberikan respons lebih cepat.)

Terakhir, mungkin merupakan ide yang buruk untuk menggunakan API saat Anda harus lebih mempersempit hasil permintaan API Anda. Dalam kasus seperti itu, lebih baik membingkai pekerjaan Anda sebagaipenelusuran(untuk Elasticsearch) ataukueri(untuk WDQS).

Rincian

MediaWiki Action API yang digunakan untuk Wikidata didokumentasikan dengan cermatdi halaman API Wikidata.Anda dapat menjelajahi dan bereksperimen dengannya menggunakanAPI Sandbox.

Bot

Kami mempersilahkan kehadiran bot yang baik

Anda juga dapat mengakses API dengan menggunakan bot. Untuk informasi lebih lanjut tentang bot, lihatWikidata:Bots.

Aliran Perubahan Terbaru

Apa itu?

Aliran Perubahan Terbaru menyediakan aliran perubahan berkelanjutan dari semua wiki Wikimedia, termasuk Wikidata:https://stream.wikimedia.org

Kapan menggunakannya?

Gunakan Aliran Perubahan Terbaru saat proyek Anda mengharuskan Anda bereaksi terhadap perubahan secara waktu nyata atau saat Anda memerlukan semua perubahan terbaru yang berasal dari Wikidata -- misalnya, saat menjalankan layanan kueri Anda sendiri.

Rincian

Aliran Perubahan Terbaru berisi semua pembaruan dari semua wiki menggunakan protokolacara yang dikirim server.Anda perlu memfilter pemutakhiran Wikidata di sisi klien.

Anda dapat menemukan antarmuka webdi stream.wikimedia.orgdan membaca semuanya di halamanEventStreams.

Timbunan

Apakah mereka?

Timbunan Wikidata adalah ekspor lengkap dari semua Entitas di Wikidata:https://dumps.wikimedia.org

Kapan menggunakan mereka?

Gunakan tumpukan saat kumpulan hasil Anda cenderung sangat besar. Anda juga akan menemukan tumpukan penting saat menyiapkan layanan kueri Anda sendiri.

Jangan gunakan tumpukan jika Anda memerlukan data saat ini: tumpukan memerlukan waktu yang sangat lama untuk mengekspor dan bahkan lebih lama lagi untuk menyinkronkan ke layanan kueri Anda sendiri. Tumpukan juga tidak cocok jika Anda memiliki batasan yang signifikan pada bandwidth, ruang penyimpanan, dan/atau daya komputasi yang tersedia.

Rincian

Jika catatan yang perlu Anda lintasi banyak, atau jika kumpulan hasil Anda cenderung sangat besar, saatnya untuk mempertimbangkan bekerja dengan dump database: (tautan ke tumpukan lengkap terbaru).

Anda akan menemukan dokumentasi terperinci tentang semua dump Wikimediapada halaman "Data tumpukan" di Metadan tentang dump Wikidata khususnya di halamanpengunduhan basis data.Lihat jugaFlavoured_dumpsdi atas.

Peralatan

  • JsonDumpReaderadalah pustaka PHP untuk membaca timbunan.
  • Dengan[1]Anda akan menemukan pustaka Go untuk memproses tumpukan Wikipedia dan Wikidata.
  • Anda dapat menggunakanwdumperuntuk mendapatkan tumpukan RDF khusus sebagian.

Layanan kueri lokal

Bukan tugas kecil untuk mendapatkan tumpukan Wikidata dan mengimplementasikan alat di atas untuk bekerja dengannya, tetapi Anda dapat mengambil langkah lebih jauh. Jika Anda memiliki kapasitas dan sumber daya untuk melakukannya, Anda dapat menghosting instansi Layanan Kueri Wikidata Anda sendiri dan menanyakannya sebanyak yang Anda suka, agar tidak berselisih dengan yang lain.

Untuk menyiapkan layanan kueri Anda sendiri, ikutipetunjuk inidari tim layanan kueri, yang mencakup pengadaan salinan data lokal Anda sendiri. Anda juga dapat menemukan informasi berguna diblog postAdam Shorland tentang topik tersebut.