Dezagun gutxi, dezagun beti

Junio 21, 2008

UZEI, zer da?

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 2:00 pm

Nire azkenengo artikuluan, UZEI zentroa aipatu egin dut. Beraz, egokia iruditu zait, zentro honi buruz artikulu bat idaztea, zer den eta zertan aritzen den jakiteko.

UZEI 1977.urtean sortu zen teknologia eta lexikografia zentroa da. Zentro honen xedea euskara modernizatzea mundu moderno batean da. Aipatu beharra dago, elkarte hau irabazi asmork gabekoa dela, hots, lortu nahi dutena edozein pertsona lan-eremu deberdinetan gure hizkuntza, euskara, era egoki batez erabiltzea.

Urte batzuen ondoren, 1987.urtean hain zuzen, UZEI zentroa Eusko Jaurlaritzaren Babespeko elkarte bilakatu zen eta bi urte geroxeago Onura Publikoko aitorpena jaso zuen Eusko Jaurlaritzaren eskutik, urteetan zehar euskararen inguruan eskaini izan dituen zerbitzuengandik.

 

                                                         

 

UZEI-k honako lanen inguruan jarduten egon da:

- Hiztegi orokorra

- Hiztegi teknikoak

- Corpusgintza

- Itzulpengintza teknikoa

- Hizkuntza-teknologikoak

- Trebakuntza

 

Bibliografia:

http://www.uzei.com/home.asp

XX.mendeko euskararen corpus estilistikoa

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 1:43 pm

 XX.mendeko euskararen corpus estilistikoa UZEI elkarteak sortu duen corpusa dugu. UZEI-ren helburua euskara ikertzen duten pertsonak hizkuntza-datutegiak kontsultatzeko corpus hau baliogarria izatea da.

 

            

 

Corpusaren erabilera zein den zehatzago uler dezagun ondoko azalpena ematen da XX.mendeko euskararen corpus estilistikoaren web orrialdean ( www.euskaracorpusa.net ). Honela dio:

Corpus estatistikoaren oinarria, XX. mendeko euskal argitalpenen inbentario osoa da, irizpide batzuen arabera sailkatua gainera, ondoren ikusiko dugunez. Argitalpenek osatzen duten unibertsotik abiatuta, osotasun hori proportzionalki adieraziko duen lagina eskuratu da zozketa bidez, orotara jasotako 6.351 obra-zatik osatzen dutena.Corpus irekia da oraingoz, urtero eguneratzen dena, nahiz laster corpus itxi izatera pasako den, mende oso baten erakusgarri. Bestalde, euskara idatzia jaso da hor, ez ahozkoa. Ahozkoek badute bere lekua, baina transkribatu eta argitaratu diren neurrian jaso dira.”

Erabiltzen dituzten sailkapen irizpideak ondoak dira:

1. Epea edo garaia

    1.1. 1900-1939

    1.2. 1940-1968

    1.3. 1969-1990

    1.4. 1991-1999

2. Euskalkia

    2.1. Bizkaiera

    2.2. Gipuzkera

    2.3. Zuberera

    2.4. Lapurtera-Nafarrera (biak batean)

    2.5. Euskara batua

    2.6. Sailkatu gabeak (atal honetan astekari eta egunkarietako artikuluak sartzen dira)

3. Testu-mota:

- Saio-artikuluak, saio-liburuak, ikasliburuak, antzerkia, poesia, bertsoak, ikerketa-lanak, etab.

 

Bibliografia:

http://www.euskaracorpusa.net/

Mayo 10, 2008

EREDUZKO PROSA GAUR CORPUSA

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 4:58 pm

Ereduzko Prosa Gaur Corpusa EHUko Euskara Zerbitzuak sortutako lanabesa dugu. Corpus honetan, euskal idazle batzuen azken urteotako testuak biltzen dira, corpus konplexu bat eratzeko helburuarekin.

 

 

Corpusaren xehetasunetan sartzen bagara, esan dezakegu Corpusaren xehetasunak denera 25,1 milioi hitz dituela eta horien artean, 13, 1 milioi hitz liburuak hartzen dituztela eta bestetik, 12 milio hitz prentsak. Liburuen artean, 287 liburu daude 2000, eta 2006. urte bitartekoak eta egunkarien artean, Berria egunkaria da nagusi 10 milio hitzekin (2004- 2006 bitarteko epean) eta Herria astekaria bigarren posizioan 2 milioi hitzekin (2001-2005 bitarteko epean).

Argiago ikustearren, Corpusean datuak agertzen diren bezala jartzea komenigarria iruditzen zait:

Corpusaren xehetasunak

Denera: 25,1 milioi hitz

Liburuak

13,1 milioi hitz

2000-2006 bitarteko 287 liburu

Prentsa

12 milioi hitz

2004-2006 bitarteko Berria egunkaria (10 milioi hitz)

2001-2005 bitarteko Herria astekaria (2 milioi hitz)

Azken eguneratzea:
2007-07-07

 

 

 

 

Bibliografia:

http://www.ehu.es/euskara-orria/euskara/ereduzkoa/

ZIENTZIA ETA TEKNOLOGIAREN CORPUSA

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 4:45 pm

Kurtso amaiera honetarako, proiektu bat egingo dugu Zientzia eta Teknologiaren Corpusean eta Ereduzko Prosa Gaur Egun Corpusean oinarriturik. Hasteko, lehenengo Corpusari buruzko sarrera artikulu bat egingo dugu, bere web orriadeko datuetan oinarriturik.

1. Zer da Zientzia eta Teknologiaren Corpusa?

“Zientzia eta Teknologiaren Corpusa, edo ZT corpusa, zientzia eta teknologiaren alorreko euskarazko testu-bilduma egituratu eta etiketatua da, eta alor horietako euskararen erabilera ikertzeko baliabidea izatea du helburu nagusia. Corpus berezi edo espezializatua da, eta UPV/EHUko IXA taldeak eta Elhuyar Fundazioak elkarlanean eratu dute.”

2. ztC corpus-bertsioaren ezaugarri nagusiak ondokoak dira:

Epea:
1990-2002 (biak barne)
Eremuak:
Zientzia zehatzak
Materiaren eta energiaren zientziak
Lurraren zientziak
Biziaren zientziak
Teknologia
Orokorra
Bestelakoak
Generoak:
Oinarrizko hezkuntzako materiala
Goi-mailako liburua
Artikulu espezializatua
Dibulgazio-artikulua
Dibulgazio-liburua
Administrazio publikoko dokumentua
Egitura-etiketatzea:
TEI P4 (XML)
Automatikoa: testuaren egitura-ezaugarriak (atalburuak, atalak, azpiatalak, paragrafoak, zerrendak, taulak, oin-oharrak, irudi-oinak, eta abar.); nabarmentze-ezaugarriak (tipografikoak, hau da, letra-estiloa eta komatxo edo kakotxak)
Eskuz landua (gune orekatuko laginak): nabarmentze-ezaugarrien balioa (enfasia, aipua, atzerri-hitza, ohiz kanpoko adiera edo erabilera ironikoa, metahizkuntza, terminoa, izen berezia…)
Aurreprozesamendu linguistikoa (gune orekatuko laginak):
Corpusaren lexikoi osagarria elikatzea (EDBLn eta Elhuyar Hiztegian ez dauden eta corpusean atzeman diren maiztasun handiko lema espezializatuak)
Aldaeren normalizazioa (<reg> etiketa)
Akats ortotipografikoen zuzenketa (<corr> etiketa)
Etiketatze linguistikoa:
Erabilitako baliabide lexikalak: EDBL (http://ixa2.si.ehu.es/edbl/ )+ZT corpusaren lexikoi osagarria (Elhuyar Hiztegia+corpusaren aurreprozesamendu linguistikoan bildutako lexiko espezializatua)
Automatikoa:

  • lema eta kategoria
  • hitz anitzeko unitate ’seguruak’ eta marraz lotutako izen-elkarte diren lema konplexuak etiketatu dira, eta horien osagaien informazioa (lema eta kategoria) ere gorde da, horien araberako kontsultak egiteko aukera ere izateko
  • testu-hitz batek analisi bat baino gehiago dituenean (anbiguoa denean), desanbiguazio automatikoaren bidez analisi bat hobesten da, baina gainerako analisiak gorde egin dira
  • desanbiguazio automatikoa amaieran egin da, eskuz egindako desanbiguazio-lanetik ‘ikas’ dezan
Eskuz landua (gune orekatuko laginak):

  • desanbiguazioa: lema/kategoria mailako analisi bat baino gehiago ematen duten testu-formetarako analisi zuzena hautatu da
  • prozesamendu linguistikoan izandako akatsak zuzendu dira
  • aldaeren normalizazioa: EDBLn zehaztutako aldaera ez-estandarren agerraldiak aldaera estandarraren lemarekin etiketatu dira. EDBLn aldaeren estandartasuna ebazteko erabiltzen den iturria Euskaltzaindiaren Hiztegi Batua da
Tamaina:
Guztira: 7,6 milioi hitz (7.623.734)
Automatikoki landuak: 6 milioi hitz (5.989.976)
Automatikoki landuak eta gero eskuz berrikusiak eta zuzenduak: 1,6 milioi hitz (1.633.758)
Lema-kopurua:
Guztira: 136.792
Eskuz egiaztatuak: 69.921

 

 

Bibliografia:

http://www.ztcorpusa.net/aurkezpena.htm

BIBLIOGRAFIA AIPATZEKO MODU EGOKI ETA DESBERDINAK

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 3:49 pm

 

Gaur egun, guztiok dakigunez, idatzizko lan bat egitea oso garrantzitsua da, baina are garrantzitsuagoa da bibliografia era egoi batean aipatzea gure lanaren amaieran. Horrela, artikulu honen bidez bibliografia aipatzeko modu egoki eta desberdinak ikusiko ditugu. Ezin dugu bibliografian modu berdinean aipatu liburu bat, edo artikulu batnahiz aldizkari bat; bakoitzak bere arauak ditu eta bibliografia aipatzeko pausoak desberdinak dira.

Ikus dezagun Duke Unibertsiteak bibliografia aipatzeko zer pausu jorratzen dituen:

- Egunkarietako artikuluak:

 * From a printed journal

* Articles with multiple authors

* From an online journal

* Full-text article from a database 

- Aldizkarietako artikuluak:

* From a printed magazine

* From an online magazine

* Full-text article from a database

- Liburuak:

* Book with a single author

* Book with two authors

* Book with three or more authors

* Electronic book

* Article within a book

* Encyclopedias and other multi-volume works 

- Aldizkariak:

* From a printed newspaper

* from an online newspaper

* Full-text articles from a database

- Beste material batzuk:

* Web page

* Online posting

* Email message

* Book review

* Government document

 

Ondorioz, taula hauen bitartez antzeman ahal izan dugu bibliografia era egoki batean aipazeko zer motatako idazkia den kontutan hartu behar dugula, eta ez erabili bibliografia era orokor batean.

 

 

 

Bibliografia:

http://library.duke.edu/research/citing/workscited/

Abril 24, 2008

ELRA

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 10:22 am

 

ELRA (European Language Resources Association), Luxenburgon sortu zen 1995. urteko otsailean, hain zuzen.

Bere helburuei dagokionez, Baliabide linguistikoen erakunde honek, ondokoa esaten digu:

ELRA’s missions are to promote language resources for the Human Language Technology (HLT) sector, and to evaluate language engineering technologies. To achieve these two major missions, we offer a range of services, listed below and described in the “Services around Language Resources” section.

Hau aipatuta, helburuak zehazki eman ditzakegu:

1. Identification of language resources 
2. Promotion of the production of language resources 
3. Production of language resources 
4. Validation of language resources
5. Evaluation of systems, products, tools, etc., related to language resources
6. Distribution of language resources
7. Standardisation

 

BIBLIOGRAFIA:

http://www.elra.info/

Diciembre 12, 2007

JUDASEN EBANGELIOA

Archivado en: Joseba Abaitua, Littera — janirearenaza @ 1:11 pm

Judasen ebangelioa izen hau hartzen du ebangelio erabili bategatik. Elizako aitek aitortu zuten ebanjelio honen izena jarri zutenek sekta gnostiko bat izan zela, II.mendean osatuz.

Ebanjelio hau egipton agertu zen 70.hamarkadan, nahiz eta urte askoz pentsatuz galdurik zegoela.

Testuan Judas Iscariote apostuluaren figuraren balorazio positiboa egiten da, non lau ebanjelio kanonikoetan Jesus traidoretzat kontsideratua izan zen. Ebangelio apokrifo honek dio, Iscariote izan zela bere diszipulu maitatuena, eta bere maestroari autoritate erromatarrak entregatu zizkiola, Jesusek berak eginiko plan bategatik.

Urte honetan, 2007.urtean, eskuizkribu originala begiratu ondoren, April D.DeConickek, Rice Unibertsiteteko (Estatu Batuak) irakaslea, interpretazio hori ezeztatu zuen, itzulpen txar bat izan zela aitortuz.

                    

Diciembre 4, 2007

PARES

Archivado en: Ana Elejabeitia, Joseba Abaitua, Littera — janirearenaza @ 7:07 pm

PARES (el portal de archivos españoles) Kultura Ministerioaren proiektu bat da. Bere zeregina, Interneten bidez Patrimonio Histórico Documental Español -aren difusioa egitea da, internet bidez.

Proiektu ireki eta dinamiko hau, beste proiektu artxibistiko batzuentzako ere difusioa da, era publikoan, nahiz pribatuan.

Eta amaitzeko, bere erabilerari dagokionez, hiru era erabili ahal ditugu nahi duguna aurki dezagun:

1. Bilaketa sinplea

2. Bilaketa aurreratua

3. Artxiboen Inbentario Dinamikoa 

Bibliografia:

http://pares.mcu.es/

Noviembre 24, 2007

CINDOC

Archivado en: Ana Elejabeitia, Joseba Abaitua, Littera — janirearenaza @ 3:55 pm

CINDOC (Centro de información y documentación cientifica) consejo superior de investigaciones cientificas-eko (CSIC) organismoa da. Bere betebeharrari dagokionez, informazio zientifikoa analizatzea, errekopilatzea, banatzea eta potentziatzea bezalako ekintzak dira.

                        

Bere helburuak honakoak dira:

1. CSIC-eko programazio zientifikoan euskarri dokumental egoki bat edukitzea.

2. Ikerketa proiektuak garatzea dokumentzaio zientifikoaren alorrean.

a) Beste zientzia batzuekin bere erlazioa aztertzea, informazio zientifikoaren eduki eta garapena.

b) Sistema, metodo, tratamentuzko teknikak, informazioaren errekuperaketa eta difusioa errekuperatzea, hauek analizatuz, diseinatuz nahiz garatuz.

c) Produkzio zientifikoaren ikasketak egitea, ezagueraren gai guztietan.

d) Espainiar zientifikoek erabilitako lexikoaren ikasketa terminologikoak egitea.

3. Espainiar produkzio zientifikoa biltzea eta bere hedapena zabaltzea, base datu batzuen bitartez, bai banatuz, bai sortuz, bai garatuz.

4. Informazio zientifiko espezifikoa edonoren esku jarri.

5. Teknologiaren erabilera sustatzea.

Bibliografia:

http://www.cindoc.csic.es/info/infobjetivos.html

BibTeX

Archivado en: Ana Elejabeitia, Joseba Abaitua, Littera — janirearenaza @ 3:43 pm

BibTeX, erreferentziadun listei formatoa ematen duen tresna da eta horretarako LaTeX dokumentuak hartzen dute garrantzia.

      

BibTeX Oren Patashnikek eta Leslie Lamportek sortu zuten 1985.urtean. Bibtex-en betebeharra oso garrantzitsua da aipamen bibliografikoen erabilera errazten baitu. Beraz, edukiaren eta estiloaren banaketa Latex-ek, zein XHTML-ek eta CSS-ek erabiltzen dute.

Bibtex-ek erabiltzen duen artxibo formatoa testuetan oinarritutakoa da eta estilotik independientea da.

Hurrengokoak BibTeX estiloaren eredu desberdinak dira: article, book, booklet, conference, inbook, incollection, inproceedings, manual, mastersthesis, misc eta horrelakoak dira.

Bibliografia:

BibTeX kontzeptuari buruzko artikulua Wikipedian.

BibTeX kontzeptuari buruzko informazioa ingelesez

     

Entradas siguientes »

Blog de WordPress.com.