A while back my father started asking about name disambiguationbecause he wanted to be able to run a search in, say, Google Scholar and come up with ONLY the publications of a single author.  Our conversations brought up a lot of interesting issues, and many more questions from him. I figured this exchange could be interesting and informative to others, so here are the highlights and some key examples.

Hace un tiempo mi padre empezó a preguntar sobre la desambiguación de un nombre, porque quería poder hacer una búsqueda por ejemplo en Google Scholar y encontrar sólo las publicaciones de un solo autor. De nuestras conversaciones salieron un montón de temas interesantes, y muchas más preguntas suyas. Pensé que este intercambio podría ser interesante e informativo a otros, así que aquí están los aspectos más destacados y algunos ejemplos clave.

In the USA the main entity that works towards disambiguating published authors/creators is the Library of Congress (LOC), which makes complete sense since they need to be able to keep track of and distinguish the millions of authors found in their OPAC (Online Public Access Catalog). Basically the LOC needs to be able to distinguish multiple authors with the same name, or similar names. It also needs to be able to identify authors who publish under different name. To do this, the LOC established its Name Authority File where new names are added all the time.

En los EE.UU. la principal entidad que trabaja para desambiguar autores publicados es la Biblioteca del Congreso (LOC), cosa que tiene mucho sentido ya que deben poder hacer seguimiento y distinguir los millones de autores que se encuentran en su OPAC (Catálogo en Línea). Básicamente la LOC necesita poder de distinguir varios autores con el mismo nombre, o nombres similares. También debe ser capaz de identificar autores que publican bajo un nombre diferente. Para ello la LOC estableció su Archivo de Autoridad de Nombre, donde nuevos nombres se añaden todo el tiempo.

To have your name included in the Library of Congress Name Authority File you need to have published something, and a librarian needs to realize that you have a common enough name to create confusion in the catalog, and problems with the index. The librarian will then create (or ask the LOC to create) an authority file for the author, including some basic bibliographic information on the publication where the librarian is taking the information from. The librarian will also try to include any other information available. (example from LOC authority)

Para que su nombre sea incluido en el archivo Autoridades de Nombres de la Biblioteca del Congreso necesita haber publicado algo, y un bibliotecario tiene que darse cuenta de que su nombre es lo suficientemente común para crear confusión en el catálogo, y puede crear problemas con el índice. El bibliotecario creará (o le pedirá a la LOC que cree) una ficha de autoridad de autor, incluyendo algunos datos bibliográficos básicos de la publicación de donde el bibliotecario haya tomando la información. El bibliotecario también tratará de incluir cualquier otra información disponible.

Here’s the name authority file for Andrés Caicedo, a Caleño author whose name has enough variations to illustrate this point without becoming overwhelming (try Shakespeare!). Using the LOC’s brand new Linked Data Service, here is Caicedo’s file. You can see that there are five variations to his name, in addition to the authorized version, and if the cataloging librarian has done his or her work correctly, you could search for any of these variations, and realize the “authorized” version of his name is “Caicedo Estela, Andrés, 1951-1977”, and search by that.

Aquí está el archivo de autoridad de de Andrés Caicedo, un autor caleño, cuyo nombre tiene variaciones suficientes para ilustrar este punto, sin llegar a ser abrumador (vea la ficha de Shakespeare!). Usando Linked Data Service, una nueva herramienta de la LOC, aqui esta la ficha de Caicedo. Aquí puede ver que hay cinco variaciones de su nombre, además de la versión autorizada, y si el bibliotecario de catalogación ha hecho su trabajo correctamente, usted puede buscar cualquiera de estas variaciones y darse cuenta de que la versión “autorizada” de su nombre es “Caicedo Estela, Andrés, 1951-1977”, y buscar por este.

  • Caicedo Stella, Andrés, 1951-1977
  • Stella, Andrés Caicedo, 1951-1977
  • Caicedo, Andrés
  • Estela, Andrés Caicedo, 1951-1977
  • Caicedo, Andrés, 1951-1977

Do keep in mind that the Name Authority File is a living, breathing creature, and these files will change over time. Do note that his maternal last name (Estela) has been misspelled, plus there is the common confusion seen with Latin names in Anglo name files. (We tend to use two last names, the paternal and the maternal, but we should be filed under the paternal last name.) At some point this name file probably included only a birth date, and was later updated to include a death date.

Tenga en cuenta que cualquier archivo de autoridad de nombre es una entidad viviente y estos archivos cambian con el tiempo. Dese cuenta de que anteriormente su apellido materno (Estela) ha sido mal escrito. Además vemos el error común, y la confusión con los nombres latinos en archivos de nombres anglosajones. (Tenemos la tendencia a utilizar dos apellidos, el paterno y materno, y se nos debe clasificar bajo el apellido paterno.) En algún momento este nombre de archivo probablemente incluía sólo una fecha de nacimiento, y fue actualizado posteriormente para incluir su fecha de muerte.

Now to the Google Scholar search issue. Unlike the OPAC at your local library, the web is not currently indexed, nor subject to any kind of authority control, and because of this it is nearly impossible to run a simple search and find everything about only one specific author. Until someone forces some order and authority control on the web, there are a couple tricks that might help improve searching on the web.

Ahora con el tema de búsqueda en Google Scholar. A diferencia del catálogo público de su biblioteca local, la web no se encuentra indexada, ni se somete a ningún tipo de control de autoridades y debido a esto es casi imposible realizar una búsqueda simple y encontrar todo sobre un solo autor específico. Hasta que alguien obliga a un cierto orden y control de autoridades en la web, hay algunos trucos con los que quizá ayuden a mejorar la búsqueda en la web.

First of all, most library OPACs are open to the public, and while this won’t give you access to their shelves or databases, it will allow you to consult them and discover interesting material. Two great places to start are the LOC’s OPAC and WorldCat. You’ll notice that while WorldCat doesn’t publicly include the authorized version of the author’s name, it does link out to the correct bibliographic record in the corresponding OPAC.

En primer lugar, la mayoría de los catálogos públicos de cualquier biblioteca están abiertos al público, y mientras esto no le dará acceso a sus estantes o bases de datos, si le permitan consultarlos y descubrir material interesante. Dos buenos lugares para comenzar son el catálogo de la LOC y WorldCat. Se dará cuenta de que, aunque WorldCat no incluye la versión autorizada del nombre del autor públicamente , si lo vincula al registro bibliográfico correcto en el OPAC correspondiente.

The book’s entry in WorldCat / La ficha del libro en WorldCat

Caicedo WorldCat

 

And in the Pittsburgh OPAC / Y en el catálogo de Pittsburgh

So it seems that until someone forces some order and authority control on the web, there is no simple solution for this type of search. After writing the first draft of this entry I attended AALL and discovered Google is working on a tool to resolve this problem, My Citations.

Así que parece que hasta que alguien force un poco de orden y control de la autoridad sobre la web no hay una solución simple para este tipo de búsqueda. Después de escribir el primer borrador de esta entrada asistí AALL y descubrió que Google está trabajando en una herramienta para resolver este problema, My Citations (mis citas).