Narin, Capítulos VII, VIII e IX

Neste post falaremos de três capítulos dedicados a elaboração matemática: The influence methodology (VII); Influence maps (VIII) e Reliability (IX);

The Influence Methodology
  • Segundo Narin, a IF é caracterizado pela designação de um conjunto de propriedades médio para um grupo de artigos, sem que seja necessária a determinação da taxa de citação de cada artigo individualmente;
  • Narin diz:
    • "The influence methodology assumes that, although citations to papers vary within a given journal, aggreagates of publications can be characterized by the influence measures of the journals in which they appear."
  •  Aspectos da IF são:
    • Classificação por assunto de um revista;
    • Classificação por tipo de pesquisa (nível), para o campo biomédico;
    • Medições de influência por citação de cada revista: Este ponto é responsável por promover o critério qualitativo ou de utilização na análise;
  • Narin ressalta algumas ressalvas: 1) O número total de publicações da entidade sendo analisada mede apenas a atividade, não importância; e 2) O número total de citações de uma série de publicações depende do tamanho do grupo e não possui significado em uma escala absoluta;
  • Garfield, segundo Narin, define o fator de impacto como "the ratio of the number of citations the journal receives to the number of publications in a specified earlier time period" e determina três limitações desta abordagem:
    • O tamanho da revista é corrigido pelo número de publicações, mas o tamanho das publicações em si é desconsiderado. Isto é importante pois Reviews possuem artigos longos com muitas citações;
    •  As citações não recebem peso. Narin diz que citações feitas por outras revistas de alto prestígio devem receber um peso maior se o que se busca é determinar o prestígio da revista sendo analisada;
    • Não existe normalização entre as diferentes características de citações peculiares a cada campo;
  • Nesta seção vemos três medidas de influência relacionadas entre si, cada uma medindo um aspecto da influência de uma revista com reconhecimento do tamanho de cada uma. Estas são:
    • The influence weight of the journal: a size-independent measure of the weighted number of citations a journal receives from other journals, normalized by the number of references the journal gives to other journals;
    • The influence per publication for the journals: the weighted number of citations each article, note or review in a journal receives from other journals;
    • The total influence of the journal: the influence per publication times the total number of publications;
  • Narin entre agora nas formulações matemáticas para criar um esquema que atribua peso ao que quer que esteja sendo analisado;
  • Citation matrix: Descreve intereações entre os membros do que está sendo analisado (artigos, pesquisadores, universidades, etc...). Ela contém a informação sobre o fluxo de influência entre as unidades anlisadas;
    • Há uma distinção entre referências e citações nestas matrizes. Um termo Cij indica tanto o número de referências que unidade i faz a unidade j quanto o número de citações que a unidade j recebe da unidade i.
    • O intervalo de tempo deve ser considerado cautelosamente. A matriz assume uma constante e estável natureza das unidades. Narin exemplifica:
      •  "[...] if the units of study are journals, it is assumed that they have not changed in size relative to each other and represent a contant subject area. Journals in rapidly changing fields and new journals would therefore have to be trated with caution.";
Exemplo de matriz dado por Narin.

Exemplo prático de uma matriz de citações fornecido por Narin

  • Pesos da influência [Influence weights]: Medida indepente do tamanho delimita a partir da matriz de citação:
    • "The citation matrix may be thought of as an "input-output" matrix with the medium of exchange being the citation. Each unit gives out references and receives citaitons; it is above average if it has a "positive citation balance", i. e., receives more than it gives out."
    • Através deste raciocínio é possível aproximar o peso de cada unidade (Wi(1)) pela seguinte equação:

    • Porém este é apenas o incício do aprofundamento matemático desta seção, o restante das elaborações algébricas serão omitidos devido a complexidade.
  • O autor passa a deliberar sobre a classificação por assunto das revistas:
    • "There is here, as in any taxonomic procedure, some degree of arbitrariness in the precise choice of fields and of the location of boundaries between fields. Pairs of fields frequently have regions of contiguity. Field boundaries evolve with time; an area which was once a region of overlap between two established fields can develop into an independent field with its own relatively self-contained literature."
  • Ele afirma que a classificação dos maiores grupos é feita de acordo com diversos fatores específicos de cada caso. Não entrarei na especificidade de classificação mostrada no relatório;
  • Existem revistas que não podem ser categorizadas em um único grupo, elas podem ser classificadas em dois núcleos:
    • Bi-disciplinares: Revistas que devem ser eliminadas quando estamos analizando o fluxo de influência entre dois campos, pois complicam em demasia os resultados. O exame das citações destas revistas indica o quanto um subcampo retira de seus campos-pais;
    • Interseccionais: Categorias mais comum. O exame das citações destas revistas indica uma porcentagem das publicações de cada campo;
  • Classificação por nível de pesquisa: Medida aplicada por Narin ao campo Biomédico. Ele percebeu que as revistas poderia ser classificadas também pela abordagem das publicações que aceitam, do mais fundamental ao mais aplicado.
    • Nível 1 - Observação clínica
    • Nível 2 - Mix Clínico (mistura dos níveis 1 e 3)
    • Nível 3 - Investigação clínica
    • Nível 4 - Pesquisa fundamental
  • Narin constata que as revistas mais básicas são mais citadas (imagem abaixo, JAMA é de nível 1 e JBC é de nível 4);


  • O autor comenta também sobre as áreas sobrepostas entre os campos. Ele diz que essas áreas podem induzir arbitrariedades, uma vez que podem fazer parte de qualquer um dos grupos sobrepostos. Isto pode influenciar os pesos já que a maior parte das citações entre campos ocorrem nestas áreas sobrepostas;
  • Narin também comenta que existem revistas multidisciplinares que se encaixam em múltiplos campos;
  • O autor passa a comentar as hieraquias entre as revistas. Uma técnia vista anteriormente para determinação de hierarquia era o Coupling, porém esse método não possui garantias de uniformidade de posicionamento.
  • É explicado então, o sitema de hierarquia pelo método dos pesos, que segue três princípios:
    • Dá um ordem única de acordo com a medida sendo analisada;
    •  Leva em conta a significância relativa entre as relações pares;
    •  Dita o espacamento entre unidades, provendo uma escala cardinal e não ordinal;
  • Alguns exemplos são dados:
Essa hierarquia ocorre pois a P NAS US é citada mais pela Nature e Science do se refere a elas, e porque a Science é citada mais pela Nature do que se refere a Nature. Essa hieraquia é definida pelos pares.

Já essa hierarquia leva em conta os pesos de influência. Outras hierarquias podem ser feitas levando em conta as outras medidas presentes nesta tabela.


Influence maps
  • Neste capítulo (VIII) o autor mostra a construção de mapas de influência dos diversos campos. Os mapas são gerados a partir de uma série de convenções específicas de Narin;
  • Decidi omiti-los pois são muitos em quantidade, muito específicos e muito datados;

Reliability
  • Neste capítulo Narin mostra metodologias de determinação do tamanho da amostra de modo a obter um nível satisfatório de confiança;
  • Devido as diferenças da taxa de citação de cada publicação em uma mesma revista existe uma variância que precisa ser analisada para manter a confiabilidade. Narin divide a análise de confiabilidade em comparações entre grupos de publicações e comparação entre grupos de instituições;
  • Dadas duas revistas distintas, A e B, qual a chance de selecionarmos grupos de artigos da revista A e B de forma que a influência média é menor para o revista A do que para a B, sendo que a diferença de influência média real entre as revistas é delta (δ), onde δ > 0 é a única questão de interesse. Narin desenvolve essa fórmula estatisticamente:
  •  Comparação entre grupos de publicações: No exemplo dado, foram selecionadas diferentes revistas e suas médias de influência de onde todos os artigos foram retirados para análise, em seguida as referências de cada artigo foi identificada e pesada de acordo com o prestígio da revista que havia os referenciado. Essas medidas foram incorporadas ao artigo resultando na influência total de cada artigo. As distribuições de influência foram construídas e a média e variância foram computadas.
  • Diversas metodologias matemáticas são usadas e serão omitidas aqui devido a minha falta de conhecimento sobre o assunto, no entanto outras formulações são mais simples de entender e as anotarei aqui;
  • Narin constrói outra equação a partir da mostrada acima:
    • "An analysis of the functional form of this probability question will demonstrate the stability fo the influence measure. However, inverting the functional form of the equation make it easier to work with. That is, rather than examine the probability which results from drawing two samples of sizes n and nb , suppose the desired probability is specified first and then the sample sizes necessary to achieve this probability are studied. To simplify the analysis further, assume n and nb = n." 

    • Esta fórmula pode ser simplificada mais ainda:
    • Fazendo o cálculo acima, podemos descobrir o n, que representa o número de amostra necessário para estabelecer a confiança nos resultados;
  • Comparação entre grupos de instituições: Comparações podem ser feitas se inferirmos o nível de influência/publicação das publicações das instituições espalhadas por diversas revistas. Assume-se que há uniformidade de citação e padrões de influência entre instituições dentro das revistas. Primeiro deve ser formado uma pseudo-revista para cada instituição por meio do agrupamento de suas publicações nas revistas reais. A partir daí podemos analisar os grupos de publicações das pseudo-revistas da mesma forma que se faz na comparação entre grupos de publicações, porém as pseudo revistas necessitam de curvas diferentes pois sua relação variância-média é alterada;
  • Narin elabora ainda mais as formulações estatísticas nesta seção de modo a estabelecer a ponte entre os dois tipos de comparação;
  • Narin conclui:
    • "Summarizing this chapter, the influence methodology seems to be a viable alternative to individual citation counts for sets of 50 or more papers. In these cases, if a substantial difference in average influence is found, one can predict, with reasonable confidence, a difference in influence between the two sets of papers. In addition, the Physical Review and Journal of the American Chemical Society data indicate that the publications of the faculty members of highly prestigious universities are somewhat more highly cited than publications of faculty members of other universities. The combination of difference in influence/publication for the journals plus the tendency for the publications of the prestigious universities to be more highly cited, would tend to reinforce any difference obtained by ascribing the general influence to sets of publications when comparing the publications of prestigious and less prestigious universities."

Comentários

Postagens mais visitadas deste blog

O Evolucionista Voador - Costa

TS - Jia Ye (2021)

Brown Sequard