<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
        {mso-style-priority:34;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.EmailStyle19
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle20
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">We’re running v2.1 in our sandbox, and have major concerns with the PUI indexer bringing back lots of irrelevant results on our public site. It seems that it’s trying to bring back “related” records that don’t actually contain the user’s
 search terms. For example, this search done in 2.0 brings back 2 results (<a href="http://archivesspace.vmi.edu/search?utf8=%E2%9C%93&q=rockenbach+AND+papers">http://archivesspace.vmi.edu/search?utf8=%E2%9C%93&q=rockenbach+AND+papers</a>), while the exact
 same search in 2.1 retrieves 139 results (searchresults1.jpg), most of which are components that don’t actually contain those search terms (plus, the relevant resource record is on the second to last page of the results (searchresults2.jpg)).<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I created a live example in the public sandbox with the search “Rockenbach AND papers”, which retrieves a relevant collection plus 4 components, none of which contains those search terms:
<a href="http://public.archivesspace.org/search?utf8=%E2%9C%93&op%5B%5D=&q%5B%5D=rockenbach+AND+papers&limit=&field%5B%5D=&from_year%5B%5D=&to_year%5B%5D=&commit=Search">
http://public.archivesspace.org/search?utf8=%E2%9C%93&op%5B%5D=&q%5B%5D=rockenbach+AND+papers&limit=&field%5B%5D=&from_year%5B%5D=&to_year%5B%5D=&commit=Search</a>. One of the results, “Component Six”, is not even part of the “Samuel D. Rockenbach Papers” collection.
 We’re guessing it’s in the results because it shares a top container with the other results (Box 1).
<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Our question: is this intentional behavior? If so, is there a way to turn it off? (I.e. revert to the old indexing rules, where the search retrieves results based on keywords only and nothing else). We have many items that share a physical
 container but are unrelated to each other, so this is unhelpful and confusing for our users.<span style="color:#1F497D">
</span><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Rachel Maderik<o:p></o:p></p>
<p class="MsoNormal">Systems and Technology Librarian<o:p></o:p></p>
<p class="MsoNormal">501D Preston Library<o:p></o:p></p>
<p class="MsoNormal">Virginia Military Institute<o:p></o:p></p>
<p class="MsoNormal">Lexington, VA 24450<o:p></o:p></p>
<p class="MsoNormal">540-464-7572<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>