Küsimus:
Kuidas eraldada paljude ajakirjaartiklite esitatud / vastuvõetud kuupäevad automaatselt?
paginated
2015-06-14 23:04:44 UTC
view on stackexchange narkive permalink

Ma uurin oma ala ajakirjades avaldatud paberite töötlemisaegu. Olen märganud, et mõõdikud, mida ajakirjad reklaamivad (nt Elsevieri ajakirja teadmised), ei vasta minu kogemusele ega hiljuti avaldatud artiklitele, nii et tahtsin teha oma uuringu. (Ma arvan, et nad võtavad arvesse pabereid, mille toimetaja kohe tagasi vaatab, ilma et neid ülevaatamisele saadetaks, nii et keskmine tundub üsna soodne. Mind huvitab rohkem tegelikult aktsepteeritud paberite keskmine aeg.)

Kavatsen kajastada kõiki hiljuti (viimased 12 kuud) ilmunud artikleid 10–20 eri kirjastuse ajakirjas (nt Elsevier, T&F, Wiley), mille tulemuseks on sadu pabereid. Põhimõtteliselt võtan töö esitamise, vastuvõtmise ja veebis avaldamise kuupäeva ning arvutan ajakirja keskmise.

Kas on võimalik seda teavet automaatselt välja võtta?

Kaks vastused:
Andrew
2015-06-15 00:45:40 UTC
view on stackexchange narkive permalink

Kas olete kontrollinud, kas need andmed on teie eelistatud ajakirjade jaoks tegelikult kättesaadavad? IME ei tee kõigil oma vastuvõetud / esitatud / esmakordse veebis kuupäevi väga hõlpsasti kättesaadavaks, ehkki see on hiljuti veidi paranenud.

Kui see on olemas, on teie parim panus ilmselt HTML-i kraapimine. Mõni ajakiri pakub mängimiseks kena puhast XML-i, kuid see on tavaliselt uute veebipõhiste pealkirjade asemel traditsiooniliste kirjastuste pärandite pealkirjad.

Elsevier kasutab lihtsat HTML-märgendit (class = "articleDates"), mis sisaldab põhikuupäevi -

Saadud 23. märtsil 2015, muudetud 15 Mai 2015, vastu võetud 18. mai 2015, saadaval veebis 9. juuni 2015

Taylor & Francis sisaldab Elsevieriga sarnast teavet: vajalik element on jälle "articleDates ", kuid kahjuks on selles ilma mõjuva põhjuseta palju reavahetusi!

Lõpuks näib, et Wiley ei avalda esitatud / aktsepteeritud kuupäevi (vähemalt mitte kõigi jaoks) ajakirjad); "publishingHistoryDetails" annab kõigepealt veebi, millest pole palju abi.

Suurepärane näide selle kohta, mida saate teha * kui * andmed on olemas, vaadake PLoS-i ajakirju: https://metarabbit.wordpress.com/2013/06/05/how-long-does-plos-take-to- ülevaade-paber-kõik-plos-ajakirjad-nüüd /
Tänan soovituse eest, ma ei märganud, et HTML-ist teabe hankimine oleks üsna lihtne. Ja jah, mitte kõik ajakirjad (eriti Wiley's) ei paku selliseid andmeid, kuid õnneks on neid väikeses vähemuses.
@paginated on suur tõenäosus, et nad need andmed varsti avalikustavad (Ühendkuningriigi HEFCE avatud juurdepääsuga mandaat tugineb sellele ja oleks palju lihtsam, kui nad sellest teataksid, nii et on mingi surve ...) - kuid praegu ma arvan, et html on sinu parim panus. Andke meile teada, kuidas saate edasi! Mul oleks päris huvitav tulemusi näha.
Aleksandr Blekh
2015-06-15 01:27:41 UTC
view on stackexchange narkive permalink

See on huvitav küsimus (+1). Ja mulle meeldib @ Andrew vastus (+1). Sooviksin siiski pakkuda lähenemist, mis on mõnevõrra alternatiivne veebi kraapimisele. Pean silmas metahoidlate ja nende API-de kasutamist. Näiteks võite kaaluda CrossRef i kasutamist, mis pakub koos muude teenustega CrossRef Metadata Services. Sellel pakkumisel on tasuta alamhulk, mida saab kasutada lõppkasutaja otsingu sidusettevõttena (muud metaandmeteenused näivad olevat tasulised).

Seda hoidlate / API-de lähenemisviisi silmas pidades on R programmeerimiskeskkonna kasutamisel huvitav algatus rOpenSci, mis koosneb avatud teadusele keskendunud projektide kogum, arendades välja R pakette suhtlemiseks erinevate hoidlatega, sealhulgas metahoidlatega. Eelkõige tundub, et pakett rmetadata on teema jaoks kõige asjakohasem projekt (pange tähele, et see pole veel küps projekt). Küpsem, kuid siiski asjakohane projekt on pakett rcrossref . Loodetavasti võivad mõned muud rOpenSci paketid olla ka teie praeguste ja tulevaste huvide jaoks.

Suurepärane, ma polnud neist teadlik. Aitäh.
Kõik, mis ei hõlma ekraani kraapimist, oleks kindlasti praktilisest küljest parem. Kuid ... see kõik on natuke küsitav, kui muud andmekogud ei sisalda tegelikult asjakohaseid metaandmeid! Elsevieri näite kiirest kontrollist ei tundu, et nad seda teevad ...
@paginated: Minu rõõm.
@Andrew: Ma ei teeks järeldusi valimi põhjal, mille N = 1. Lisaks on praeguseid suundumusi arvestades lähitulevikus oodata vähemalt teatavat edasiminekut hoidlate ja metahoidlate esinduslikkuse ja andmete kvaliteedi osas. Niisiis võib selle lähenemisviisi proovimine anda teadlastele mugavuse (või puudumise) bibliograafilise teabe avastamise ja analüüsi automatiseerimiseks ning aitab luua nende oskuste alused loodetavasti mitte nii kaugel ajal, mil see lähenemine muutub peavooluks.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...